@uranoken 甘くて飲みやすかった。
posted at 20:14:50
ツイートの記録を停止しています
このアカウントはTwitter APIの仕様変更の影響でツイートの記録を停止しています。
記録を再開するには、Twilogにログインしてください。
Stats | Twitter歴 5,100日(2010/04/13より) |
ツイート数 31,482(6.1件/日) |
表示するツイート :
@uranoken 甘くて飲みやすかった。
posted at 20:14:50
@uranoken 多分、今日たまたまだと思う。
posted at 20:14:30
@バンガロー寺町店
posted at 20:13:30
平成最後ということで(関係ない) 2, 3, 4。 https://pic.twitter.com/uM9QDTMuBp
posted at 20:12:16
昼にカレーを食べたから身体中がカレーの匂いにまみれてる。@リバーブ https://pic.twitter.com/eNwOfpXviM
posted at 16:45:10
@wtrych 調整仕事が増えて?
posted at 22:59:28
奥さんは年度が終わったということで、お祝いw 体に悪いやつw https://pic.twitter.com/eR1ViotS7N
posted at 22:56:55
事務の人辞めちゃうんだ。統括者は大変だねぇ。
posted at 18:16:02
ストレスが溜まるな。帰りに梅田に寄るか・・・
posted at 09:14:23
ノイズキャンセリングホンの効きが悪くなった。外の音が聞こえやすいモードでスタックした感じ。2回目の修理(という名の交換)に出すしかないのか・・・
posted at 09:10:51
そのままスリープに入ったけど、キー入力に反応しないので、スリープから復帰できない・・・テストするならもう一度最初からか・・・
posted at 00:05:32
相変わらず処理中だけど、ついうっかりexposéのジェスチャーしたらそこでFinderが固まった・・・処理は後ろで動いてるけど、キー入力にもクリックにも反応しなくなった・・・一からやり直しなのか?
posted at 23:39:24
このままだと、何日かして数え上げが終わっても、ソートで止まるかなぁ・・・一応最低頻度を200にはしてみたけど、焼け石に水か。
posted at 23:01:40
丸二日経っても処理が終わらない・・・どんどんメモリの圧迫がきつい状態が長くなってるから、1ファイルの処理がどんどん重くなってんだろうなぁ・・・
posted at 23:00:42
まあ、ここまで大きいのを処理することはそんなにないだろうけど、対応できるような方向で考えたほうがいいんかなぁ・・・
posted at 22:53:07
昨日の夜から処理始めた4-gramの処理が半分くらいまで進んだけど、メモリを使い切って圧迫しまくってて、一ファイルごとの処理がすごく遅くなってる。朝起きても多分あまり進んでないだろうなぁ・・・大きなコーパスだと、メモリも128GBとか必要か・・・
posted at 22:52:38
さて、明日は一限なので、そろそろ授業準備を終わらせて風呂入って寝ないと(眠くない)。
posted at 22:48:40
なんかどこ行っても自分から鎖に塗れるんだね(なんか見た)。
posted at 22:48:13
帰って来てから、雨降る前に買い物行けるか?と思ったけど、帰りまでもたず無理だったので、ずぶ濡れ。
posted at 18:13:20
このペースで行ったら、24時間経っても終わらんよね・・・
posted at 11:24:15
n-gramは途中の処理が面倒で時間がかかるから、シングルスレッドでやってるけど、それにしてもメモリ食うな・・・オンメモリは無理か・・・
posted at 11:21:59
ウェブでテキスト適当に集めてでっかいコーパスを作って、どこまでいけるか試してみてるけど、半分くらい処理したところで、10時間くらい経ってメモリプレッシャーが真っ赤になる状態になった・・・メモリ使用量はずっと積んでるメモリを超えたまま・・・32GB積んでるんだけど・・・
posted at 11:20:36
分析のためのツール作ったり、テキスト処理したりはできるので、誰か共同研究者にしてくださいw
posted at 11:04:30
でも、とりあえず道具をちゃんと作る、ってのは、研究としては厳しいかなぁ。研究を補助する役割だから、自分だけでは無理か。誰かそれを使って研究してくれる人と一緒にやるとかじゃないとダメかなぁ・・・
posted at 10:04:15
というか、言語学で出してたのか。覚えてなかったw 言語学でアプリケーション開発だと、研究って見てもらえないよなぁ、というのもあるし、時間ない中(学内締め切り過ぎてから)で書いたので、思いっきり詰めも甘いよなぁ、というのもある。今年は、もうちょっとちゃんと準備しよ。
posted at 10:03:02
科研の結果はある程度予想してたけど、厳しい評価だったなぁ、という感じ。
posted at 10:02:29
やっぱ、大規模になると、普通に数え上げるだけでは無理なんかなぁ。NLPあたりでやってるようなところまで手を出さないとダメかなぁ・・・
posted at 09:40:21
数千万語のコーパスだと、n-gramもそれに近いくらいになったりするので並べ替えをオンメモリだと、まあ、SSD/HDDにキャッシュを作りまくって、かなり消費した上で、おそらく何日とかいう単位で時間がかかる。
posted at 09:29:38
8GBだったりすると、数千万語でも難しくなるだろうし。で、数え上げはなんとか乗り切っても、並べ替えで終わる。大きいコーパスの場合は、最低頻度100とかにすれば、並べ替えもなんとかなるかも、って感じ。
posted at 09:28:35
個人で扱う場合は、どれくらいまでを想定しとけばいいんかな?
posted at 09:25:33
トークン数が数千万語を越えると、n-gramをオンメモリで数えるのは、シャレにならんね。単純に頻度だけを数えても、32GB積んでてもあっという間に使い切る。何か方策を考えるべきか、そんなのでかいのは対応できない、にするのか。
posted at 09:25:09
今と同じくらいの諸々の負担で、お給料だけ上がるなら、移るために頑張るけど、そんな夢のような話はない。
posted at 23:15:58
@Mhoullin うちは、研究費とお給料はあれですが、変なストレスがたまるわけわかんない仕事とか、人間関係のゴチャゴチャとか、それ以外の諸々の負担が少ないので(自分で首を締めなければ)、環境としては悪くないと思うんですけどね。
posted at 23:13:07
Jltaのスライドショーは、xmlの読み込みでieに対応させるのが面倒でthmlで作ってあるんだけど、流石にデータはxmlで用意してjavascriptで動的に読み込む方法に変えたほうがいいんかなぁ。
posted at 23:10:09
@Mhoullin まあ、お上から降りてくるお金が増えない限りは状況は改善しないかなぁ・・・
posted at 22:53:27
@Mhoullin うちは、ちゃんとした組合がないんじゃないかと思います。研究科内には組合あるんですけど、互助会みたいなものだし。実際のところは研究費が別枠であるわけではないので、研究科の予算から耐震・改修費の負担分が引かれれば、当然研究費に回ってくる分も減る、と。
posted at 22:35:59
現在の研究費は、ここで仕事始めた時の半分強くらい。年々減ってるし、去年と今年(とその先数年?)は建物の耐震・改修費用で引かれてさらに少なく・・・
posted at 21:11:54
うーん、国外の学会に行くと、それだけでその年の個人研究費を使い切るだけでなく、他で使える資金があればいいけど、それがなければ自腹、というのはどうにかして欲しいとは思う。
posted at 21:10:26
ほぼ存在が知られてないとは思いますが、日本言語テスト学会 (JLTA) では、言語テスト関連のチュートリアルを作って公開しています。そのチュートリアルに、CFA、メタ分析、質的方法が新たに加わりました。http://jlta2016.sakura.ne.jp/?page_id=32
posted at 18:45:27
鎖もお金も何もない・・・
posted at 18:40:45
福岡行きたい・・・
posted at 18:39:33
つけ忘れた・・・ https://pic.twitter.com/ZxoLDFQ8W4
posted at 18:17:57
ちょっと大きめのフィクションコーパスをリファレンスにしたら、やっぱ固有名詞がキーワードとして出るね。でも、saidが結構上に来てるってことは、台詞部分が多いのか、台詞部分の導入にsaidが多用されすぎているのか。
posted at 18:17:32
別キャンパスの非常勤部屋のwifiは、相変わらずまともに使えない。いつの時代だって感じ。まだうちの建物の方がまし。やっぱ、国立はお金ないんだなぁ。
posted at 12:40:42
@uranoken ちゃんと論文書いてれば・・・
posted at 18:43:30
まあ、今すぐに変えたいのは自宅用なので、いずれにせよ自腹だけど。ほぼ仕事に使ってるのに。
posted at 18:04:56
@uranoken うちは、個人研究費ではまともなコンピュータには足りないので、科研費ないと古いコンピュータ費使い続けることに。開発者としては致命的・・・
posted at 18:03:13
旅費が別でもらえれば、研究費自体は今くらいで、数年に一度コンピュータ買い換えるくらいもらえれば十分。
posted at 17:49:42
眠い・・・
posted at 06:42:42
さて、そろそろ寝ないと・・・6時半起き・・・
posted at 03:05:50