情報更新
ツイートの記録を停止しています

 

ツイート検索

 

@casualconc
サイトメニュー
Twilogユーザー検索
新規ツイートの取得を再開しました!取得再開にはログインが必要です。

Twilog

ツイートの記録を停止しています

このアカウントはTwitter APIの仕様変更の影響でツイートの記録を停止しています。
記録を再開するには、Twilogにログインしてください。

 

@casualconc

Yasu@casualconc

  • 118フォロー
  • 486フォロワー
  • 45リスト
Stats Twitter歴
5,100日(2010/04/13より)
ツイート数
31,482(6.1件/日)

ツイートの並び順 :

表示するツイート :

2019年04月30日(火)5 tweetssource

2019年04月26日(金)6 tweetssource

4月26日

@casualconc

Yasu@casualconc

ノイズキャンセリングホンの効きが悪くなった。外の音が聞こえやすいモードでスタックした感じ。2回目の修理(という名の交換)に出すしかないのか・・・

posted at 09:10:51

4月26日

@casualconc

Yasu@casualconc

そのままスリープに入ったけど、キー入力に反応しないので、スリープから復帰できない・・・テストするならもう一度最初からか・・・

posted at 00:05:32

2019年04月25日(木)3 tweetssource

4月25日

@casualconc

Yasu@casualconc

相変わらず処理中だけど、ついうっかりexposéのジェスチャーしたらそこでFinderが固まった・・・処理は後ろで動いてるけど、キー入力にもクリックにも反応しなくなった・・・一からやり直しなのか?

posted at 23:39:24

4月25日

@casualconc

Yasu@casualconc

このままだと、何日かして数え上げが終わっても、ソートで止まるかなぁ・・・一応最低頻度を200にはしてみたけど、焼け石に水か。

posted at 23:01:40

4月25日

@casualconc

Yasu@casualconc

丸二日経っても処理が終わらない・・・どんどんメモリの圧迫がきつい状態が長くなってるから、1ファイルの処理がどんどん重くなってんだろうなぁ・・・

posted at 23:00:42

2019年04月24日(水)17 tweetssource

4月24日

@casualconc

Yasu@casualconc

まあ、ここまで大きいのを処理することはそんなにないだろうけど、対応できるような方向で考えたほうがいいんかなぁ・・・

posted at 22:53:07

4月24日

@casualconc

Yasu@casualconc

昨日の夜から処理始めた4-gramの処理が半分くらいまで進んだけど、メモリを使い切って圧迫しまくってて、一ファイルごとの処理がすごく遅くなってる。朝起きても多分あまり進んでないだろうなぁ・・・大きなコーパスだと、メモリも128GBとか必要か・・・

posted at 22:52:38

4月24日

@casualconc

Yasu@casualconc

さて、明日は一限なので、そろそろ授業準備を終わらせて風呂入って寝ないと(眠くない)。

posted at 22:48:40

4月24日

@casualconc

Yasu@casualconc

帰って来てから、雨降る前に買い物行けるか?と思ったけど、帰りまでもたず無理だったので、ずぶ濡れ。

posted at 18:13:20

4月24日

@casualconc

Yasu@casualconc

n-gramは途中の処理が面倒で時間がかかるから、シングルスレッドでやってるけど、それにしてもメモリ食うな・・・オンメモリは無理か・・・

posted at 11:21:59

4月24日

@casualconc

Yasu@casualconc

ウェブでテキスト適当に集めてでっかいコーパスを作って、どこまでいけるか試してみてるけど、半分くらい処理したところで、10時間くらい経ってメモリプレッシャーが真っ赤になる状態になった・・・メモリ使用量はずっと積んでるメモリを超えたまま・・・32GB積んでるんだけど・・・

posted at 11:20:36

4月24日

@casualconc

Yasu@casualconc

分析のためのツール作ったり、テキスト処理したりはできるので、誰か共同研究者にしてくださいw

posted at 11:04:30

4月24日

@casualconc

Yasu@casualconc

でも、とりあえず道具をちゃんと作る、ってのは、研究としては厳しいかなぁ。研究を補助する役割だから、自分だけでは無理か。誰かそれを使って研究してくれる人と一緒にやるとかじゃないとダメかなぁ・・・

posted at 10:04:15

4月24日

@casualconc

Yasu@casualconc

というか、言語学で出してたのか。覚えてなかったw 言語学でアプリケーション開発だと、研究って見てもらえないよなぁ、というのもあるし、時間ない中(学内締め切り過ぎてから)で書いたので、思いっきり詰めも甘いよなぁ、というのもある。今年は、もうちょっとちゃんと準備しよ。

posted at 10:03:02

4月24日

@casualconc

Yasu@casualconc

やっぱ、大規模になると、普通に数え上げるだけでは無理なんかなぁ。NLPあたりでやってるようなところまで手を出さないとダメかなぁ・・・

posted at 09:40:21

4月24日

@casualconc

Yasu@casualconc

数千万語のコーパスだと、n-gramもそれに近いくらいになったりするので並べ替えをオンメモリだと、まあ、SSD/HDDにキャッシュを作りまくって、かなり消費した上で、おそらく何日とかいう単位で時間がかかる。

posted at 09:29:38

4月24日

@casualconc

Yasu@casualconc

8GBだったりすると、数千万語でも難しくなるだろうし。で、数え上げはなんとか乗り切っても、並べ替えで終わる。大きいコーパスの場合は、最低頻度100とかにすれば、並べ替えもなんとかなるかも、って感じ。

posted at 09:28:35

4月24日

@casualconc

Yasu@casualconc

トークン数が数千万語を越えると、n-gramをオンメモリで数えるのは、シャレにならんね。単純に頻度だけを数えても、32GB積んでてもあっという間に使い切る。何か方策を考えるべきか、そんなのでかいのは対応できない、にするのか。

posted at 09:25:09

2019年04月23日(火)13 tweetssource

4月23日

@casualconc

Yasu@casualconc

今と同じくらいの諸々の負担で、お給料だけ上がるなら、移るために頑張るけど、そんな夢のような話はない。

posted at 23:15:58

4月23日

@casualconc

Yasu@casualconc

@Mhoullin うちは、研究費とお給料はあれですが、変なストレスがたまるわけわかんない仕事とか、人間関係のゴチャゴチャとか、それ以外の諸々の負担が少ないので(自分で首を締めなければ)、環境としては悪くないと思うんですけどね。

posted at 23:13:07

4月23日

@casualconc

Yasu@casualconc

Jltaのスライドショーは、xmlの読み込みでieに対応させるのが面倒でthmlで作ってあるんだけど、流石にデータはxmlで用意してjavascriptで動的に読み込む方法に変えたほうがいいんかなぁ。

posted at 23:10:09

4月23日

@casualconc

Yasu@casualconc

@Mhoullin うちは、ちゃんとした組合がないんじゃないかと思います。研究科内には組合あるんですけど、互助会みたいなものだし。実際のところは研究費が別枠であるわけではないので、研究科の予算から耐震・改修費の負担分が引かれれば、当然研究費に回ってくる分も減る、と。

posted at 22:35:59

4月23日

@casualconc

Yasu@casualconc

現在の研究費は、ここで仕事始めた時の半分強くらい。年々減ってるし、去年と今年(とその先数年?)は建物の耐震・改修費用で引かれてさらに少なく・・・

posted at 21:11:54

4月23日

@casualconc

Yasu@casualconc

うーん、国外の学会に行くと、それだけでその年の個人研究費を使い切るだけでなく、他で使える資金があればいいけど、それがなければ自腹、というのはどうにかして欲しいとは思う。

posted at 21:10:26

4月23日

@casualconc

Yasu@casualconc

ほぼ存在が知られてないとは思いますが、日本言語テスト学会 (JLTA) では、言語テスト関連のチュートリアルを作って公開しています。そのチュートリアルに、CFA、メタ分析、質的方法が新たに加わりました。jlta2016.sakura.ne.jp/?page_id=32

posted at 18:45:27

4月23日

@casualconc

Yasu@casualconc

ちょっと大きめのフィクションコーパスをリファレンスにしたら、やっぱ固有名詞がキーワードとして出るね。でも、saidが結構上に来てるってことは、台詞部分が多いのか、台詞部分の導入にsaidが多用されすぎているのか。

posted at 18:17:32

4月23日

@casualconc

Yasu@casualconc

別キャンパスの非常勤部屋のwifiは、相変わらずまともに使えない。いつの時代だって感じ。まだうちの建物の方がまし。やっぱ、国立はお金ないんだなぁ。

posted at 12:40:42

2019年04月22日(月)6 tweetssource

4月22日

@casualconc

Yasu@casualconc

まあ、今すぐに変えたいのは自宅用なので、いずれにせよ自腹だけど。ほぼ仕事に使ってるのに。

posted at 18:04:56

4月22日

@casualconc

Yasu@casualconc

@uranoken うちは、個人研究費ではまともなコンピュータには足りないので、科研費ないと古いコンピュータ費使い続けることに。開発者としては致命的・・・

posted at 18:03:13

4月22日

@casualconc

Yasu@casualconc

旅費が別でもらえれば、研究費自体は今くらいで、数年に一度コンピュータ買い換えるくらいもらえれば十分。

posted at 17:49:42

このページの先頭へ

×