やはり基本的にはブロック単位の圧縮 デメリットはスプリットサイズをブロックサイズ以下にしてもスプリットできなくなる場合があること 何で圧縮するかによるけど #hadoop_training posted at 11:49:27 SequenceFileについて RT @hamburger_kid: やはり基本的にはブロック単位の圧縮 デメリットはスプリットサイズをブロックサイズ以下にしてもスプリットできなくなる場合があること 何で圧縮するかによるけど #hadoop_training posted at 11:54:42 残すはテスト飲み #hadoop_training posted at 15:38:00 面白い採点方式のテストだった #hadoop_training posted at 16:52:52 いくつか正解が怪しいと思われ。。後日でもいいから訂正があれば公開してもらってスッキリしたい #hadoop_training posted at 16:59:08 @cloudera @kzk_mover 非常に有意義な3日間でした ありがとうございましたー #hadoop_training posted at 17:29:55 #hadoop_training 飲み 予約名はまんまクラウデラ様w posted at 19:01:37
topologyの設定はscriptで上手いことやりくりしましょう #hadoop_training posted at 09:53:58 HDFSへのputは生で HDFS上でシーケンスファイルにしてブロック単位にLZOするのがオススメ #hadoop_training posted at 10:42:36 でも実際はputは非常に時間がかかるのでgzipで圧縮した方が現実的と個人的には思う RT @hamburger_kid: HDFSへのputは生で HDFS上でシーケンスファイルにしてブロック単位にLZOするのがオススメ #hadoop_training posted at 10:47:50 いきなり冪等w #hadoop_training posted at 11:39:20 sqoopもhiveもイイ んが 何よりVMがイイ!! #hadoop_training posted at 12:23:01 午後は蜂の巣から #hadoop_training posted at 13:26:37 TODO HiveとPigおさらいする @myen #hadoop_training posted at 17:40:01 #hadoop_training 2日目了 Pigはシステム運用者向けに Hiveはユーザー向けに という印象 posted at 18:29:50 振り返って今日一番大事だったのはやはりSequenceFileだったと思う やはり開発者はcoreからだろう #hadoop_training posted at 22:35:37
TODO reduce side join復習する @myen #hadoop_training posted at 17:53:00 #hadoop_training 1日目了 とても楽しい!! なるほどーと唸ること数回 演習でお痛orz ガチ英語なので予習超重要 そんなとこ posted at 18:09:03 #hadoop_training 復習done やっと腹に落ちた できない子はできるまでやるしかないのだ やれやれ posted at 21:45:10
|
last update 06/01 07:11
ツイート検索
Recent
Archives
Friends
Hashtags
Stats・Feed |