nsiena

Siena.

nsiena

ツイートの並び順 : 新→古 | 古→新

表示するツイート : 全て | Replyを除く | Mentionを除く

Twilog ホーム » @nsiena » 2010年03月02日

2010年03月02日(火) 103 tweets

ソース取得:

#event DevFest 2010 Japan 得点不足のお知らせ。やはり、コミュニティ活動無し、プログラミング得点のみでは届かなかったようね。

posted at 08:05:37

セッションF1「サーチ技術とその支援によるアプリケーション」に遅参 >< #deim2010 F1

posted at 08:52:00

『頻出ファイル集合のアクセス時間を考慮した仮想ディレクトリ生成手法』 #deim2010 F1-2

posted at 08:58:16

「ファイル数の増加→探しにくい。過去のファイルをテンプレートとして使いまわしたいこともある。→ 分散したそれらをまとめた仮想ディレクトリを生成・提供する仕組みの提案。 #deim2010 F1-2

posted at 08:59:39

「同時使用ファイルを探すデスクトップ検索: Connections, FRIDAL, Semantic File Systems。自動グループ化: Windwos Ssearch, Spotlight。これらとは前提が異なる。 #deim2010 F1-2

posted at 09:03:32

「ファイル使用時間の重複に基づくクラスタリング法 (CO法) を提案してきたが再現率不足。 #deim2010 F1-2

posted at 09:05:15

使用ログから一定時間ごとにトランザクションとみなして進出集合を発見する頻出ファイル集合発見法 (FI法) も提案。同じ作業が複数の重複のない頻出集合とされることがある。 #deim2010 F1-2

posted at 09:05:22

間違えて、F9 セッションを F1 と書いてしまた

posted at 09:10:08

「今回は、頻出集合内のファイルの使用時間の重複に着目したクラスタリング法 (COFI法) を提案。実データを使った実験で F値が改善されたのを確認。 #deim2010 F9-2

posted at 09:10:38

.o(ファイルをたくさん開きっぱなしにする人のはうまくいかない気がする。そうでなくても、特定のファイルは開きっぱなしにして使うファイルがあるだけで、複数の作業が混ぜられてしまいそう。 #deim2010 F9-2

posted at 09:11:55

「Q.閉じ忘れたファイルを放置してしまうこともあるが、時間での共起性なのでうまくいかないかも。A.その場合は課題。ファイルの内容に依存しないのが長所。 #deim2010 F9-2

posted at 09:14:11

「A.アクセスの有無が基準になるので、閉じ忘れは問題ない。Q.開き続けて頻繁に書き込んでいる用例もあるので、やはり対応が必要だと思う。 #deim2010 F9-2

posted at 09:16:45

「Q.仮想ディレクトリが多くなると分からなくなるので、自動でラベル付けするなど必要かも。A.考えてみたい。 #deim2010 F9-2

posted at 09:17:04

『検索エンジンを利用した信頼性の高いQ

posted at 09:17:18

「複雑な質問だと適切なウェブページを検索するのが難しい。案: 自然言語入力 →語抽出 →演繹DBのルールで導出キーワードに変換 →問合せ拡張。 #deim2010 F9-3

posted at 09:24:17

「「富士山 次に 高い 山」で検索すると北岳について述べているのは上位10件中6件。「富士山 次に 高い 山」から「北岳」を演繹して、「富士山 次に 高い 山 北岳」で検索する場合、上位10件中9件。 #deim2010 F9-3

posted at 09:24:25

「自明な結果。検索エンジンの結果は信用されているらしい。周辺情報も得られるなどの効果も期待。 #deim2010 F9-3

posted at 09:29:26

「スニペットで既に答えがある場合も。不足することも多いので、検索結果ページからの解答自動抽出。しかし、自分でやる気はない。学生にやらせる予定。」(^^; #deim2010 F9-3

posted at 09:29:35

「Q.人的コストが高いから、演繹DBを使わずにウェブだけを使うのが近年のアプローチ。A.間違いが混ざる。辞典などのデータをひたすら突っ込むだけなので、人的コストはそれほどではないと考える。」.o(それが高コストなのでは? #deim2010 F9-3

posted at 09:30:20

「Q.演繹DBを絡めることの意味。A.(主旨が読み取れなかったので略)。DBの学会だから。」.o(演繹DBを使うことが目的化してしまってるのでは? #deim2010 F9-3

posted at 09:33:18

『関連検索履歴の提示による検索支援手法の開発』 #deim2010 F9-4

posted at 09:33:29

「調べたいことが明確で、それが明確に書かれたページが存在する場合は検索エンジンで探しやすい。そうでない場合は探すのが困難になることも多い。検索結果一覧から、適合するページを特定するのはしばしば大変に。 #deim2010 F9-4

posted at 09:35:05

「仮定: 1) 検索の初期と末期ではクエリは大きく変化する, 2) ウェブページの価値の半ん断には、その前後に閲覧されたページが何だったかという文脈も有用。→ 検索履歴DBから、クエリに関係するものを抽出し、その流れも含めて検索補助情報として提示。 #deim2010 F9-4

posted at 09:37:07

「Google Web 履歴を利用。事前に複数ユーザの履歴を収集しておく。履歴を、クエリ発行~結果閲覧を「検索行動」、時間的に連続するそれらを「タスク」、連続しないが同一意図のものでのそれらを「ジョブ」と定義。 #deim2010 F9-4

posted at 09:40:00

「navigational っぽいタスクは事前に除去。自明な検索なので支援する意義がないから。 #deim2010 F9-4

posted at 09:43:30

「提示時には、クエリと類似する検索行動を含むジョブをランキングして抽出。また、重要なページは閲覧時間が長い、検索結果会のページは見落とされがち、なので価値が高いと仮定。 #deim2010 F9-4

posted at 09:43:37

「実験。被験者が期待した検索行動が取れなかった/解答に辿りつけなかった事例は割愛。有意な検索をできた事例では、提案システムで時間が短くなった。 #deim2010 F9-4

posted at 09:45:45

「Q.時間が長くかかってしまった事例では何が原因? A.被験者グループの性質が原因と思われる。事前知識を多く持っていたため、支援が無くても早く終わってしまった。 #deim2010 F9-4

posted at 09:48:13

「Q.思円情報にはアクセスがあったか。役立ったと思われたか。A.ログにも利用が記録されていて、役に立ったと被験者は感じてくれた。 #deim2010 F9-4

posted at 09:48:17

「Q.過去に関連するウェブ履歴がない場合は? A.今は全く出ない #deim2010 F9-4

posted at 09:49:16

『検索エンジンを用いた英文前置詞誤り修正支援』 #deim2010 F9-5

posted at 09:49:27

「英語の前置詞としてどれを使えばいいか分からない場合がある。e.g.「{for,in} this reason, ...」。検索エンジンから事例を検索して、前置詞の出現確率を計算して、修正候補を提示するシステムを開発。 #deim2010 F9-5

posted at 09:51:52

「コンマの前後で英文を分割。前置詞の数だけ英文を分割。he graduated from college in 1995 → he graduated from college と college in 1995。 #deim2010 F9-5

posted at 09:54:13

「lang:en で site: が TLD なページのみに限定してフレーズ検索。出現の割合や出現か異数で、4段階評価を加えて、確からしさを分かりやすく表示。 #deim2010 F9-5

posted at 09:57:09

「実験。NYT の記事50文。前置詞 83/166 個の誤り。ネイティブチェッカと比較。誤りの検出 79/83 vs 74/83。誤検出 59 vs 52。精度、再現率、F値とも提案システムの方が高い。自動修正も勝利。 #deim2010 F9-5

posted at 10:00:35

「誤検出・修正の原因: 前置詞が文頭で短いフレーズのため膨大な結果, 稀な語句のため事例が少なすぎる, 文法的には正しいが意味が異なるためユーザの判断が必要。4段階評価にも改善の余地あり。 #deim2010 F9-5

posted at 10:03:01

「Q.結果をランダム抽出できるわけではないので偏りに注意。Q.人手で文例を検索して結果数を参照することが良くあるが、その結果の用例をまた検索してみてもいいかも。Q.数だけが基準ではないのでは。あえて使いたい表現もある。 #deim2010 F9-5

posted at 10:06:08

\ネムタイヨー/

posted at 10:06:16

セッションB10「情報の信頼性評価手法と分析」 #deim2010 B10

posted at 10:31:02

『Web上の地域写真集合における説得度のスコアリング』 #deim2010 B10-1

posted at 10:31:29

「信頼性の研究じゃないよー #deim2010 B10-1

posted at 10:32:17

「ウェブには多くの地域情報が存在。上位にあるページを見ても行きたいと思えないことが多い。ユーザが欲しいのは観光名所の情報。何が有名かではなく、それがどういうものか。説得度。 #deim2010 B10-1

posted at 10:34:19

「Persuasive Photo。内面的良さ: トピック内の Subject に対するスコア。事前に計算可能。表面的良さ: 入力の写真集合における写真それぞれに対するスコア。見た時に判断される。 #deim2010 B10-1

posted at 10:36:12

「Persuasiveness = Subject Goodness(本研究で分析・推定) × Photo Quality(従来研究)。 #deim2010 B10-1

posted at 10:38:01

「Persuation Factor は典型性で測る: Persuasive Object (被写体)→Visual Rank, Persuasive Position (撮影位置)→Position Rank #deim2010 B10-1

posted at 10:42:26

「偏りが出ないように、指示相補広さを保証: Support Rank。HITS 的な考え方。P = SG * 0.8 + PQ * 0.3 と仮設定した検索結果を、Picasa のキーワード検索と比較。重み付けは、地域によって異なる。 #deim2010 B10-1

posted at 10:46:14

「良い撮影者の画像だけを検索したのではだめか。A.いい写真を探すならそれでもいいかもしれないが、代替画像を探したい場合にはそれでは十分でないことも。ユーザの質 (住民, 旅行者, ……) をパラメータとして扱って行きたい。 #deim2010 B10-1

posted at 10:48:55

『映像の類似性とアノテーションの非類似性に基づく映像の信憑性判断支援』 #deim2010 B10-2

posted at 10:49:11

「YouTube やニコ動で, 虚偽を含むものがあると感じたことがあるか 443/1432人。やらせ、合成など (例: 携帯電話の電磁波でポップコーンができる)。信頼性が問われる鵜呑みにする危険性 #deim2010 B10-2

posted at 10:55:00

通信できなくて困ってるうちに落ちてた #deim2010

posted at 11:39:57

『脚注と参考文献を用いたWikipedia記事の信頼性評価の一手法』 #deim2010 B10-5

posted at 11:43:30

「ウィキペディアは誰でも編集できるので信頼できるとは限らない。脚注と参考文献に着目。 #deim2010 B10-5

posted at 11:48:38

「N1={書籍名(参考文献, 脚註)}, N2={信頼するURL,新聞記事}, N3={信頼性不明なURL,ニュース記事}。これらの組合せで、8種類の信頼度R を定義して比較実験。 #deim2010 B10-5

posted at 11:48:45

「ウィキペディア記事を信頼性に応じて 3段階に分類。◎12件, ○28件, △160件を閾値決定に利用。◎87件, ○200件, △300件 を評価対象として利用。 #deim2010 B10-5

posted at 11:50:46

「分類精度は、基本指標が N1>N2>N3 で、R=2N1+N2+N3 の場合が最良。課題: 脚注の分類方法, 情報源の実在性の確認, 他の信頼性評価の手がかり, 他の信頼性評価手法との比較 #deim2010 B10-5

posted at 11:55:07

「Q.秀逸な記事の定義は? A.利用者の投票で秀逸な記事が決まっているので信頼できる。」.o(秀逸だと思わされてしまっているような紛らわしい記事は混じってないのかしらん。 #deim2010 B10-5

posted at 11:56:45

「Q.3段階に分けたが、明確な基準はない。その他の記事にも秀逸/良質な記事があるはず。A.人手で確認して除外して実験した。 #deim2010 B10-5

posted at 11:58:00

お昼を食べてしまったので、午後は(も)落ちそう。ハッシュタグ使ってない人が多いらしいのは残念。 #deim2010

posted at 12:57:18

『DBSJ授賞式・記念講演』: この部屋は電波状況が悪いので切れるかも #deim2010

posted at 13:03:00

「DBSJ授賞式・記念講演」: この部屋は電波状況が悪いので切れるかも #deim2010

posted at 13:04:13

上林奨励賞: 小山聡氏, 豊田正史氏

posted at 13:05:55

功労賞: 真名垣昌夫氏 → 記念講演「企業研究者としての思い」 #deim2010

posted at 13:07:15

業績賞: 日立製作所 ソフトウエア事業部 #deim2010

posted at 13:08:22

ただいま表彰中: 各受賞者情報 <http://db-event.jpn.org/deim2010/program.html#awardtalk > #deim2010

posted at 13:10:00

電波が弱いせいで、バッテリがごりごりと減っていく……。電波が足りない。もっと電波を!

posted at 13:15:07

功労賞記念講演『企業研究者としての思い:データ工学への取り組みを振り返って』 #deim2010

posted at 13:27:13

企業研究者としての思い、の予定だったけど、大学も大変という話を耳にして、研究マネジメントという観点から話したい。 #deim2010

posted at 13:27:23

href=# にして、スクリプトで動作するページ。スクリプトのロードに失敗すると HTML もリンクが機能しないごみになる。くず仕様だ。つぃたぁとか(ry

posted at 13:32:57

目眩がぐらぐらして気持ち悪い。つらい。

posted at 13:36:54

大切なこと: 「テクノロジーインパクト」「アプリケーションインパクト」(使われてなんぼ、価値を提供できることが必要。新規応用領域を買いたくできるのが望ましい。)「マーケットインパクト」(ビジネスを構築しないとだめ。新しい市場の創出。) #deim2010

posted at 13:40:09

望むらくは「社会インパクト」も。どこまで視野に入れられるか。研究計画・活動の段階で、、それを念頭に置くことができるか。目的を明確にすることで、次のステップで必要なことも見えてくる。 #deim2010

posted at 13:43:02

.o(おっと。冒頭に 「 を付けるのを忘れてた。 #deim2010

posted at 13:45:54

「マネジメント方式は複数ある。そのための考え方の一つとして経験を語らせていただいた #deim2010

posted at 13:48:03

.o(技術偏重、視野狭窄になるのは良くない。などと若輩ながらずうずうしくも大いに同意。 #deim2010

posted at 13:49:29

業績賞記念講演『業績賞の御礼に変えて~情報爆発時代におけるデータ活用~』 #deim2010

posted at 13:51:24

「情報の量的変化 (情報量の爆発的増加)。質的な変化 (モノ・人の動きの見える化)。これからのインフラは効率化重視から利用者中心へ。社会インフラとITの融合が、利用者サービスの向上に繋がる。 #deim2010

posted at 13:53:36

「大規模イベント、自然災害、ラッシュ、一斉帰省、事故・障害など →情報量の予想外の急激な変化。クラウドにより柔軟にリソースを投入可能に。リアルタイム性, インテリジェンス性の獲得。 #deim2010

posted at 13:56:43

「情報サービスを支えるデータベース技術。今後、ますます重要になって行くだろう。 #deim2010

posted at 13:57:49

「日立のソフトウェア事業部の概要。横浜の基盤ソフトウェア研究開発を拠点に、海外拠点へ。若手の海外派遣・交流や標準化への関与も。 #deim2010

posted at 14:02:23

「情報サービスの未来像を是非一緒に作っていきましょう! #deim2010

posted at 14:05:04

「DEIM2010 表彰式・クロージング」 #deim2010

posted at 14:08:14

.o(名前を転記しようと思ったけれど早くて無理。後で DEIM2010 のサイトに載るであろうということで割愛。 #deim2010

posted at 14:10:22

学生奨励賞: 及川孝徳 (早稲田)「字幕テキストの利用によるブログで引用されたテレビ番組の推定」 #deim2010

posted at 14:11:10

学生奨励賞: 許 延偉 (名古屋)「リレーショナルデータベースの(ry #deim2010

posted at 14:11:46

.o(やっぱむり ^^; #deim2010

posted at 14:12:24

学生奨励賞 x8。以上(酷) #deim2010

posted at 14:15:56

最優秀インタラクティブ発表賞 x1, 優秀インタラクティブ発表賞 x8 #deim2010

posted at 14:16:48

.o(企業研究者だけでなく、開発現場の人にも興味を持ってもらえるといいなぁ。発表だってできるはずだし、使えるアイデアだってあるはずだよ! #deim2010

posted at 14:28:35

これにておしまい! 皆様おつかれさまでした、ありがとでした! #deim2010

posted at 14:28:55

#blog DEIM2010 聴講メモ 2010/03/02 Tue <http://twilog.org/nsiena/date-100302/asc > #deim2010

posted at 14:30:45

うあ。みないで垂れ流し続けてたので気付かなかったけれど。いつの間にかフォロワがだいぶ増えてる。近しい人が中に入ってるかもと思うと、ちょっとつぶやきにくくなった気がしないでもない。

posted at 16:22:56

そもそもこの TL は。そっち(どっち)じゃなくて、あっち(どっち)を向いて組み上げているので。あまり期待されるような事にはならないと思う。と、予防線を張るてすてす。

posted at 16:27:17

東京に着くのはどうやら 19:00 頃になりそう。

posted at 16:30:22

えぇい。新規に <http://twitter.com/ > に要求してるのに、前回アクセスしてた <http://twitter.com/search?q=%23deim2010 > を応答する Twitter、ばくは(ry

posted at 17:50:59

もうすぐ品川。広げた荷物を片付けねばだ。

posted at 18:43:16

ばんごはんして、本屋さんに寄って、ただいまして、しゃわわった

posted at 21:54:07

にゃららっと、たいむらいんに復帰

posted at 21:57:40

@zakkas783 うにー ^^)/

posted at 21:59:35

旅行中に失った紅茶分の補充を開始。お湯ぐらぐら。

posted at 22:06:29

@zakkas783 変態ww 今回、「SQLによる数独の解法」<http://db-event.jpn.org/deim2010/program.html#f6 > なるものならあった。

posted at 22:36:35

姫栗カレンダーってなんですか、それっておいしかったりしますか? >> IME

posted at 22:45:16

@zakkas783 これは……ちょー変態 ^^;;

posted at 22:49:28

どれだけ本気を出せばそうなるですか < .@nsienaさんが本気出したら、世界が平和になります。 http://king-soukutu.com/twit/?n=honki&id=nsiena

posted at 22:56:30

last update 06/04 08:59

ツイート検索

«2010年3月»
1234567
891011121314
15161718192021
22232425262728
293031    

Recent

Archives

» more...

Friends

» 全てのFriendsを見る...

Hashtags

» 全てのHashtagsを見る...

Stats・Feed