|
Twilog ホーム
» @nsiena
» 2010年03月02日
「ファイル数の増加→探しにくい。過去のファイルをテンプレートとして使いまわしたいこともある。→ 分散したそれらをまとめた仮想ディレクトリを生成・提供する仕組みの提案。 #deim2010 F1-2 posted at 08:59:39 「同時使用ファイルを探すデスクトップ検索: Connections, FRIDAL, Semantic File Systems。自動グループ化: Windwos Ssearch, Spotlight。これらとは前提が異なる。 #deim2010 F1-2 posted at 09:03:32 使用ログから一定時間ごとにトランザクションとみなして進出集合を発見する頻出ファイル集合発見法 (FI法) も提案。同じ作業が複数の重複のない頻出集合とされることがある。 #deim2010 F1-2 posted at 09:05:22 間違えて、F9 セッションを F1 と書いてしまた posted at 09:10:08 「今回は、頻出集合内のファイルの使用時間の重複に着目したクラスタリング法 (COFI法) を提案。実データを使った実験で F値が改善されたのを確認。 #deim2010 F9-2 posted at 09:10:38 .o(ファイルをたくさん開きっぱなしにする人のはうまくいかない気がする。そうでなくても、特定のファイルは開きっぱなしにして使うファイルがあるだけで、複数の作業が混ぜられてしまいそう。 #deim2010 F9-2 posted at 09:11:55 「Q.閉じ忘れたファイルを放置してしまうこともあるが、時間での共起性なのでうまくいかないかも。A.その場合は課題。ファイルの内容に依存しないのが長所。 #deim2010 F9-2 posted at 09:14:11 「A.アクセスの有無が基準になるので、閉じ忘れは問題ない。Q.開き続けて頻繁に書き込んでいる用例もあるので、やはり対応が必要だと思う。 #deim2010 F9-2 posted at 09:16:45 『検索エンジンを利用した信頼性の高いQ posted at 09:17:18 「複雑な質問だと適切なウェブページを検索するのが難しい。案: 自然言語入力 →語抽出 →演繹DBのルールで導出キーワードに変換 →問合せ拡張。 #deim2010 F9-3 posted at 09:24:17 「「富士山 次に 高い 山」で検索すると北岳について述べているのは上位10件中6件。「富士山 次に 高い 山」から「北岳」を演繹して、「富士山 次に 高い 山 北岳」で検索する場合、上位10件中9件。 #deim2010 F9-3 posted at 09:24:25 「スニペットで既に答えがある場合も。不足することも多いので、検索結果ページからの解答自動抽出。しかし、自分でやる気はない。学生にやらせる予定。」(^^; #deim2010 F9-3 posted at 09:29:35 「Q.人的コストが高いから、演繹DBを使わずにウェブだけを使うのが近年のアプローチ。A.間違いが混ざる。辞典などのデータをひたすら突っ込むだけなので、人的コストはそれほどではないと考える。」.o(それが高コストなのでは? #deim2010 F9-3 posted at 09:30:20 「Q.演繹DBを絡めることの意味。A.(主旨が読み取れなかったので略)。DBの学会だから。」.o(演繹DBを使うことが目的化してしまってるのでは? #deim2010 F9-3 posted at 09:33:18 「調べたいことが明確で、それが明確に書かれたページが存在する場合は検索エンジンで探しやすい。そうでない場合は探すのが困難になることも多い。検索結果一覧から、適合するページを特定するのはしばしば大変に。 #deim2010 F9-4 posted at 09:35:05 「仮定: 1) 検索の初期と末期ではクエリは大きく変化する, 2) ウェブページの価値の半ん断には、その前後に閲覧されたページが何だったかという文脈も有用。→ 検索履歴DBから、クエリに関係するものを抽出し、その流れも含めて検索補助情報として提示。 #deim2010 F9-4 posted at 09:37:07 「Google Web 履歴を利用。事前に複数ユーザの履歴を収集しておく。履歴を、クエリ発行~結果閲覧を「検索行動」、時間的に連続するそれらを「タスク」、連続しないが同一意図のものでのそれらを「ジョブ」と定義。 #deim2010 F9-4 posted at 09:40:00 「提示時には、クエリと類似する検索行動を含むジョブをランキングして抽出。また、重要なページは閲覧時間が長い、検索結果会のページは見落とされがち、なので価値が高いと仮定。 #deim2010 F9-4 posted at 09:43:37 「実験。被験者が期待した検索行動が取れなかった/解答に辿りつけなかった事例は割愛。有意な検索をできた事例では、提案システムで時間が短くなった。 #deim2010 F9-4 posted at 09:45:45 「Q.時間が長くかかってしまった事例では何が原因? A.被験者グループの性質が原因と思われる。事前知識を多く持っていたため、支援が無くても早く終わってしまった。 #deim2010 F9-4 posted at 09:48:13 「英語の前置詞としてどれを使えばいいか分からない場合がある。e.g.「{for,in} this reason, ...」。検索エンジンから事例を検索して、前置詞の出現確率を計算して、修正候補を提示するシステムを開発。 #deim2010 F9-5 posted at 09:51:52 「コンマの前後で英文を分割。前置詞の数だけ英文を分割。he graduated from college in 1995 → he graduated from college と college in 1995。 #deim2010 F9-5 posted at 09:54:13 「lang:en で site: が TLD なページのみに限定してフレーズ検索。出現の割合や出現か異数で、4段階評価を加えて、確からしさを分かりやすく表示。 #deim2010 F9-5 posted at 09:57:09 「実験。NYT の記事50文。前置詞 83/166 個の誤り。ネイティブチェッカと比較。誤りの検出 79/83 vs 74/83。誤検出 59 vs 52。精度、再現率、F値とも提案システムの方が高い。自動修正も勝利。 #deim2010 F9-5 posted at 10:00:35 「誤検出・修正の原因: 前置詞が文頭で短いフレーズのため膨大な結果, 稀な語句のため事例が少なすぎる, 文法的には正しいが意味が異なるためユーザの判断が必要。4段階評価にも改善の余地あり。 #deim2010 F9-5 posted at 10:03:01 「Q.結果をランダム抽出できるわけではないので偏りに注意。Q.人手で文例を検索して結果数を参照することが良くあるが、その結果の用例をまた検索してみてもいいかも。Q.数だけが基準ではないのでは。あえて使いたい表現もある。 #deim2010 F9-5 posted at 10:06:08 \ネムタイヨー/ posted at 10:06:16 「ウェブには多くの地域情報が存在。上位にあるページを見ても行きたいと思えないことが多い。ユーザが欲しいのは観光名所の情報。何が有名かではなく、それがどういうものか。説得度。 #deim2010 B10-1 posted at 10:34:19 「Persuasive Photo。内面的良さ: トピック内の Subject に対するスコア。事前に計算可能。表面的良さ: 入力の写真集合における写真それぞれに対するスコア。見た時に判断される。 #deim2010 B10-1 posted at 10:36:12 「Persuasiveness = Subject Goodness(本研究で分析・推定) × Photo Quality(従来研究)。 #deim2010 B10-1 posted at 10:38:01 「Persuation Factor は典型性で測る: Persuasive Object (被写体)→Visual Rank, Persuasive Position (撮影位置)→Position Rank #deim2010 B10-1 posted at 10:42:26 「偏りが出ないように、指示相補広さを保証: Support Rank。HITS 的な考え方。P = SG * 0.8 + PQ * 0.3 と仮設定した検索結果を、Picasa のキーワード検索と比較。重み付けは、地域によって異なる。 #deim2010 B10-1 posted at 10:46:14 「良い撮影者の画像だけを検索したのではだめか。A.いい写真を探すならそれでもいいかもしれないが、代替画像を探したい場合にはそれでは十分でないことも。ユーザの質 (住民, 旅行者, ……) をパラメータとして扱って行きたい。 #deim2010 B10-1 posted at 10:48:55 「YouTube やニコ動で, 虚偽を含むものがあると感じたことがあるか 443/1432人。やらせ、合成など (例: 携帯電話の電磁波でポップコーンができる)。信頼性が問われる鵜呑みにする危険性 #deim2010 B10-2 posted at 10:55:00 「N1={書籍名(参考文献, 脚註)}, N2={信頼するURL,新聞記事}, N3={信頼性不明なURL,ニュース記事}。これらの組合せで、8種類の信頼度R を定義して比較実験。 #deim2010 B10-5 posted at 11:48:45 「ウィキペディア記事を信頼性に応じて 3段階に分類。◎12件, ○28件, △160件を閾値決定に利用。◎87件, ○200件, △300件 を評価対象として利用。 #deim2010 B10-5 posted at 11:50:46 「分類精度は、基本指標が N1>N2>N3 で、R=2N1+N2+N3 の場合が最良。課題: 脚注の分類方法, 情報源の実在性の確認, 他の信頼性評価の手がかり, 他の信頼性評価手法との比較 #deim2010 B10-5 posted at 11:55:07 「Q.秀逸な記事の定義は? A.利用者の投票で秀逸な記事が決まっているので信頼できる。」.o(秀逸だと思わされてしまっているような紛らわしい記事は混じってないのかしらん。 #deim2010 B10-5 posted at 11:56:45 上林奨励賞: 小山聡氏, 豊田正史氏 posted at 13:05:55 ただいま表彰中: 各受賞者情報 <http://db-event.jpn.org/deim2010/program.html#awardtalk > #deim2010 posted at 13:10:00 電波が弱いせいで、バッテリがごりごりと減っていく……。電波が足りない。もっと電波を! posted at 13:15:07 href=# にして、スクリプトで動作するページ。スクリプトのロードに失敗すると HTML もリンクが機能しないごみになる。くず仕様だ。つぃたぁとか(ry posted at 13:32:57 目眩がぐらぐらして気持ち悪い。つらい。 posted at 13:36:54 大切なこと: 「テクノロジーインパクト」「アプリケーションインパクト」(使われてなんぼ、価値を提供できることが必要。新規応用領域を買いたくできるのが望ましい。)「マーケットインパクト」(ビジネスを構築しないとだめ。新しい市場の創出。) #deim2010 posted at 13:40:09 望むらくは「社会インパクト」も。どこまで視野に入れられるか。研究計画・活動の段階で、、それを念頭に置くことができるか。目的を明確にすることで、次のステップで必要なことも見えてくる。 #deim2010 posted at 13:43:02 「情報の量的変化 (情報量の爆発的増加)。質的な変化 (モノ・人の動きの見える化)。これからのインフラは効率化重視から利用者中心へ。社会インフラとITの融合が、利用者サービスの向上に繋がる。 #deim2010 posted at 13:53:36 「大規模イベント、自然災害、ラッシュ、一斉帰省、事故・障害など →情報量の予想外の急激な変化。クラウドにより柔軟にリソースを投入可能に。リアルタイム性, インテリジェンス性の獲得。 #deim2010 posted at 13:56:43 #blog DEIM2010 聴講メモ 2010/03/02 Tue <http://twilog.org/nsiena/date-100302/asc > #deim2010 posted at 14:30:45 うあ。みないで垂れ流し続けてたので気付かなかったけれど。いつの間にかフォロワがだいぶ増えてる。近しい人が中に入ってるかもと思うと、ちょっとつぶやきにくくなった気がしないでもない。 posted at 16:22:56 そもそもこの TL は。そっち(どっち)じゃなくて、あっち(どっち)を向いて組み上げているので。あまり期待されるような事にはならないと思う。と、予防線を張るてすてす。 posted at 16:27:17 東京に着くのはどうやら 19:00 頃になりそう。 posted at 16:30:22 えぇい。新規に <http://twitter.com/ > に要求してるのに、前回アクセスしてた <http://twitter.com/search?q=%23deim2010 > を応答する Twitter、ばくは(ry posted at 17:50:59 もうすぐ品川。広げた荷物を片付けねばだ。 posted at 18:43:16 ばんごはんして、本屋さんに寄って、ただいまして、しゃわわった posted at 21:54:07 にゃららっと、たいむらいんに復帰 posted at 21:57:40 @zakkas783 うにー ^^)/ posted at 21:59:35 旅行中に失った紅茶分の補充を開始。お湯ぐらぐら。 posted at 22:06:29 @zakkas783 変態ww 今回、「SQLによる数独の解法」<http://db-event.jpn.org/deim2010/program.html#f6 > なるものならあった。 posted at 22:36:35 姫栗カレンダーってなんですか、それっておいしかったりしますか? >> IME posted at 22:45:16 @zakkas783 これは……ちょー変態 ^^;; posted at 22:49:28 どれだけ本気を出せばそうなるですか < .@nsienaさんが本気出したら、世界が平和になります。 http://king-soukutu.com/twit/?n=honki&id=nsiena posted at 22:56:30
|
last update 06/04 08:59
ツイート検索
Recent
Archives
Friends
Hashtags
Stats・Feed |