2015年09月18日

グーグル社員「Googleのシステムは10億個のファイル・20億行のコード・合計86TBでできている」

1 : 海江田三郎 ★ :2015/09/18(金) 09:44:26.71 ID:???.net
http://gigazine.net/news/20150918-google-2billion-code/


Googleのエンジニアリング・マネージャーであるレイチェル・ポートヴィンさんが、「The Motivation for a Monolithic Codebase」と題した講演の中で、Googleのシステムが86TB(テラバイト)でできていることを明かしました。

講演ムービーはコレ。話は5つのテーマに分けて行われていて、Googleのリポジトリについての話は1番目、3分過ぎから始まります。

2015年1月時点で、総ファイル数は10億、ソースファイルの数は900万、コードは20億行あり、3500万回のコミットがあって、内容は86TBあるとのこと。そして、営業日1日に対してのコミット回数は4万5000回。

累積コミット数のグラフはこんな感じ。左側の回数目盛りは40までですが、それぞれ1目盛りが1000万回分に相当。2000年1月1日からの数字ですが、コミットが1000万回を越えたのは2012年ごろのこと。回数はぐんぐん増えていて、2015年1月時点で3500万回まで増えています。

Googleで働く「Googler」は2万5000人、世界に12あるオフィスで働いています。1日あたりのコミット回数は4万5000回とありましたが、そのうち1万5000回が人間の手によるもの、3万回が自動化されたシステムによるもの。ファイルリードリクエストは1日に10億回で、ピーク時には80万QPS(秒間クエリ処理数)に到達するとのこと。

これが1週間のコミット数を、人の手によるものと全体とを分けてグラフ化したもの。単位は1000回なので、だいたい人の手によるコミットは週間7万5000回ほどLinuxのカーネルが4万ファイルで1500万行あるのに対して、Googleのリポジトリは25万ファイル・1500万行が人の手によって毎週変更されています。累計のサイズは900万ファイルで20億行にもなります。

Windowsの公式Facebookページによると、Windows XPは4500万行のコードでできていたとのこと数字だけを単純に比較すると、Googleは3週間でWindows XP全体に相当する量のリポジトリを変更している、ということになります。

転載元スレッド:http://anago.2ch.sc/test/read.cgi/bizplus/1442537066/
【IT】グーグルエンジニアリング・マネージャー「Googleのシステムは10億個のファイル・20億行のコード・合計86TBでできている」





2 : 名刺は切らしておりまして :2015/09/18(金) 09:46:19.22 ID:rIeJ3HhX.net
要約 私の戦闘力は530000です


3 : 名刺は切らしておりまして :2015/09/18(金) 09:46:59.60 ID:tzxk9RVc.net
そんなボリュームあるのにさくさく動くのか


4 : 名刺は切らしておりまして[sage] :2015/09/18(金) 09:47:12.05 ID:pr+8YDkK.net
86TB
え、そんなもんなのか?
嘘だろ



5 : 名刺は切らしておりまして[sage] :2015/09/18(金) 09:49:07.86 ID:2lIGWHjP.net
>>4
プログラムだけでってことだろ
データはもっとあるやろ



6 : 名刺は切らしておりまして[sage] :2015/09/18(金) 09:53:05.68 ID:CnL4KkVi.net
あの検索の結果を人の手でやってたなんて、凄いよな


7 : 名刺は切らしておりまして[sage] :2015/09/18(金) 09:53:31.05 ID:S0O+9n5b.net
オラクル居そう


8 : 名刺は切らしておりまして :2015/09/18(金) 09:53:53.07 ID:3gjg4199.net
思ったより規模が小さいな


9 : 名刺は切らしておりまして[sage] :2015/09/18(金) 09:54:30.61 ID:D/aNQ0de.net
20億行/10億ファイル
1ファイルあたり2行のファイル



23 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:33:35.59 ID:+G/4v29V.net
>>9
> ソースファイルの数は900万



24 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:33:42.05 ID:fzqNTgXU.net
>>9
ソースファイルは900万だよ



11 : 名刺は切らしておりまして :2015/09/18(金) 10:02:45.65 ID:nZbVlcbM.net
すげぇちょっと想像できねぇ


12 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:06:19.11 ID:FBjMuWdR.net
システムがでかくなるのはスパゲティバカだらけの証拠

「これだけの多様なものがほんのこれだけのもので動いています」「すげー、さすがー」だろ普通



17 : 名刺は切らしておりまして :2015/09/18(金) 10:13:51.51 ID:PQ9kjkod.net
>>12
馬鹿は口挟まなくていいよ。



18 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:17:57.35 ID:jO8YsKoO.net
>>12
似たような処理を何度も繰り返すような、スパゲティコードの結果のファイルサイズではないと思うけど
そんなレベルのものはgoogleじゃコミットされないはず



19 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:26:27.61 ID:+G/4v29V.net
>>12
システム全体がこの程度で済んでるんだから、どう考えても小さいだろ



21 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:30:15.00 ID:z99E705i.net
>>18
こんだけデカイシステムだと似たようなコードが入り込む余地は十分あると思うけどな。
逆にスピード重視(ちょっと実装して試してダメならすぐ捨てる)っぽいから、
共通化に力を入れると効率を落とすと思う。



13 : 名刺は切らしておりまして :2015/09/18(金) 10:06:38.21 ID:7U+PYOpn.net
小さな変更じっとpush


14 : 名刺は切らしておりまして :2015/09/18(金) 10:10:54.74 ID:ETSKi6ed.net
Googleの人が書いたソースはコメントがしっかり入ってるからメンテはし易いんだろうな


15 : 名刺は切らしておりまして :2015/09/18(金) 10:11:19.56 ID:6OdINof5.net
恐ろしいコミット回数
自動運転で対抗するのは大変だな



20 : 名刺は切らしておりまして :2015/09/18(金) 10:30:02.64 ID:eyXCLY0H.net
検索だけで?
それとも他のも全部入ってんの?



22 : 名刺は切らしておりまして :2015/09/18(金) 10:31:21.70 ID:eyXCLY0H.net
スパゲティ回避のためにオブジェクト指向やリファクタリングが出来た。
ってもそれももう古いのかもしれんけど



25 : 名刺は切らしておりまして :2015/09/18(金) 10:34:19.13 ID:eyXCLY0H.net
ヤホーなんてその昔ウェブサーファーなる職種があって
文字通り手でサイト見つけてDBに登録してたらしいからな。
俺っちサーファー、息抜きにはスタバ外せねえっす、みたいな
雑誌のインタビュー見た記憶がある。



26 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:40:09.24 ID:bmIJvuj+.net
でか過ぎる。640KBのメモリがあれば十分なはずだ


27 : 名刺は切らしておりまして :2015/09/18(金) 10:41:15.62 ID:PQ9kjkod.net
>>26
寝言は寝てから言えよ



30 : 名刺は切らしておりまして :2015/09/18(金) 10:45:01.96 ID:6H7hsCvu.net
>>26
EMSメモリ買えよ



36 : 名刺は切らしておりまして :2015/09/18(金) 11:00:04.11 ID:57C0p1um.net
>>30
いや、バンク切り替えだろ



37 : 名刺は切らしておりまして :2015/09/18(金) 11:04:57.02 ID:ai8YHHxa.net
>>36
EMSメモリってバンク切り替えだぞ。知ったか乙。



46 : 名刺は切らしておりまして[sage] :2015/09/18(金) 12:47:42.00 ID:dwCAcL5N.net
>>26
背中に挿すメモリー 買うしかないな
たしか2メガと4メガあったはす

あとお金あるなら コプロも



28 : 名刺は切らしておりまして :2015/09/18(金) 10:44:17.88 ID:u93I78dz.net
半分はやさしさだろ


29 : 名刺は切らしておりまして :2015/09/18(金) 10:44:35.46 ID:eyXCLY0H.net
ソースの言語は?Python?


31 : 名刺は切らしておりまして :2015/09/18(金) 10:48:31.23 ID:eyXCLY0H.net
DB は何使ってんだろ? Postgres ?


34 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:54:15.25 ID:AZB2t80V.net
>>31
RDMSなんか使ってない。自前で開発したのを使ってるよ。
Google が NoSQLの基礎を築いた



32 : 名刺は切らしておりまして[sage] :2015/09/18(金) 10:50:13.04 ID:AZB2t80V.net
80兆バイト÷20億行=4万バイト
一行辺り40KBって、くっそ長いコードだなって思ったら総ファイル容量か。
バイナリも含むリポジトリ全体ってことね。



35 : 名刺は切らしておりまして :2015/09/18(金) 10:59:24.47 ID:57C0p1um.net
そんな巨大ソフトちゃんと動かすなんて神の領域


38 : 名刺は切らしておりまして :2015/09/18(金) 11:08:06.67 ID:rLBwHRf+.net
いったい何をそんなに書き換えてるんだろう?


39 : 名刺は切らしておりまして[sage] :2015/09/18(金) 11:14:43.14 ID:5R0wVoXj.net
毎時4300万本のカセットテープにバックアップ

ピーギョーーー



40 : 名刺は切らしておりまして[sage] :2015/09/18(金) 11:15:45.15 ID:2s3SAsWo.net
すーなのあーらーしーにー
かくさーれたー
ぐーぐるほんしゃにすんでいる



41 : 名刺は切らしておりまして[sage] :2015/09/18(金) 11:16:56.77 ID:EYMZuZyJ.net
コードどころか
関数そのものがあっちの世界だからなあ、グーグルの基幹システムは



49 : 名刺は切らしておりまして :2015/09/18(金) 13:10:31.93 ID:PPQM66so.net
>>41
インド人が得意な、超絶再帰コードは怖い。行数は少ないんだけどループから抜ける条件がよくわからなかったりする。



42 : 名刺は切らしておりまして :2015/09/18(金) 11:32:17.54 ID:VnCphEwI.net
この場合のコミットって何を意味してるんだ?
書き換え?



43 : 名刺は切らしておりまして :2015/09/18(金) 11:58:29.57 ID:y90C/Sfk.net
ライザップも真っ青


44 : 名刺は切らしておりまして[sage] :2015/09/18(金) 12:14:11.61 ID:CnL4KkVi.net
プログラミング自体が自動化生成されてない時点で時代遅れ


45 : 名刺は切らしておりまして :2015/09/18(金) 12:30:09.07 ID:WstQkgLt.net
>>44
馬鹿の負け惜しみみたいなレスだな



元祖オワタあんてな復活
http://news.owata-net.com/

気になるAmazonの本


トラックバックURL

 コメント一覧 (16)

    • 1. 名無しさん@まとめたニュース
    • 2015年09月18日 20:30
    • >>42
      バージョン管理ソフトだろ
    • 2. 名無しさん@まとめたニュース
    • 2015年09月18日 20:34
    • 20億行とか想像できません
    • 3. 名無しさん@まとめたニュース
    • 2015年09月18日 20:42
    • >>12
      特盛りスパゲティが正確に動いてるのがすげーよ
    • 4. 名無しさん@まとめたニュース
    • 2015年09月18日 20:45
    • 東京ドーム100杯分ぐらいピンとこない
    • 5. 名無しさん@まとめたニュース
    • 2015年09月18日 20:54
    • よくもそんな全体像を把握できるもんだな
    • 6. 名無しさん@まとめたニュース
    • 2015年09月18日 21:15
    • 何のこっちゃかさっぱりわからん
      イメージもできん
      やっぱ、文系は駄目だな
    • 7. 名無しさん@まとめたニュース
    • 2015年09月18日 21:29
    • 恐る恐るだが、コミット数はデータベースのであって、プログラミングじゃあないんだよね
    • 8. 名無しさん@まとめたニュース
    • 2015年09月18日 21:49
    • コミットてライザップかよ
    • 9. 名無しさん@まとめたニュース
    • 2015年09月18日 22:19
    • 多分全体像を掴んでる奴は誰もいないだろうなw
    • 10. 名無しさん@まとめたニュース
    • 2015年09月18日 22:35
    • あと20年も経てば
      更に100万倍くらいの量になってそう
    • 11. 名無しさん@まとめたニュース
    • 2015年09月18日 23:36
    • 米7
      そんなわけないじゃん、プログラムのコミットに決まってる。逆にデータコミットが1日数千万ですむと思うか?
    • 12. 名無しさん@まとめたニュース
    • 2015年09月19日 00:19
    • どうせ合計で20億行になるように因果逆転コミットしてるんでしょ
    • 13. 名無しさん@まとめたニュース
    • 2015年09月19日 00:59
    • たいしたことないとか言ってる奴は絶対理解してないだろwww
      俺もわからんwww
    • 14. 名無しさん@まとめたニュース
    • 2015年09月19日 03:25
    • しかし、何でこいつら他人の事馬鹿馬鹿言うんだろうなw

      お前らが書いてる訳でもなかろうにw

    • 15. 名無しさん@まとめたニュース
    • 2015年09月19日 10:22
    • 素人臭いコメントばっかでワロタ
    • 16. 名無しさん@まとめたニュース
    • 2015年09月19日 12:43
    • ID:FBjMuWdRには
      「じゃーおめーがGoogle作ってみろよ」と面と向かって言ってやりたい


コメントフォーム
記事の評価
  • リセット
  • リセット

コメントを投稿してくれる方へ
いくつかのエロい単語やURL等は使えません。
下記の投稿は無断で削除する場合があります。予めご了承ください。
・荒らし行為(宣伝行為含む)
・犯罪的なコメント
・差別的なコメント
・過激な下ネタ

他ブログのネタ満載 アンテナページへ


スポンサードリンク
記事検索
月別アーカイブ
QRコード
QRコード
読者登録
LINE読者登録QRコード
スポンサードリンク