夜フクロウはまだ対応してくれてない。でも、すぐやってくれるだろうね。夜フクロウのバージョンアップの細かさは異常なほど。RT @satokazzz: これからは #青空文庫 も使えるようになるわけですね。 #aozorabunko posted at 12:47:36
posted at 22:18:05
「TEXTの読み方」を作ったのはもう10年近くも前になるのかもしれません。確かにこれは古すぎて笑ってしまうくらいです。ノスタルジックには浸れますけど。何とかしたいです。: TEXTの読み方 http://bit.ly/mPeeY8 #aozorabunko posted at 11:38:00
posted at 20:52:48
当時は第一第二水準の文字しか打てなかったけど、打てない文字は脇に置いておいて、全文テキスト化することの利点だけを主眼に置いて作業をすすめられていました。問題はあるけど、あとからそこに文句を言われてしまうけど、まずはやってみる姿勢が素晴らしいと思いました。 #aozorabunko posted at 12:39:26 青空文庫をはじめたきっかけはやはり当時の福井大学(現大阪大学)の岡島さんのサイトに影響すること大ですよね。岡島さんら国語学者の方たちはパソコン通信(PC-VAN)の時代からすでに権利の切れた作品の全文テキスト化をしてました。 #aozorabunko posted at 12:34:10
通過点と言うことで。RT @aobeka: 本日の横光利一「上海」で、青空文庫の作ったファイルが1万に達しました。入力は、文庫の言い出しっぺの野口さん。校正が点検グループで作業を切り回してきた小林さんと門田さん。 http://bit.ly/jjOwLl #aozorabunko posted at 10:09:22
posted at 09:16:14
13年前にこんなことを書いていたのか。RT @aobeka: 青空文庫2年目で、テキストでは、ヘペベ/へぺべがしょっちゅう入れ替わると教えられた。 http://bit.ly/jkhyhS 後に、点検作業時の標準チェック項目に指定。 #aozorabunko posted at 23:26:53
ちょっとダウンロードしてみます。RT @aobeka: 例えばGitHubで青空文庫の公開レポジトリを作ると、cards以下の全公開ファイルを、圧縮して引き落とすようなことができる。やってみると、本日の最新全部入りを、問題なく取得できた。 #aozorabunko posted at 16:31:05
http://bit.ly/ie7TdM がきっかけで、伊丹万作の「戦争責任者の問題」が物凄くRTされていた。 #aozorabunko : 図書カード:戦争責任者の問題 http://bit.ly/g4GTI5 posted at 17:33:17
これも、ついに公開!という感じですね。関係者の方々、ご苦労様でした。RT @eunheui: お、青空文庫、今日の公開作品は宮本百合子の『伸子』ですね。 http://t.co/9dn5wwx #aozorabunko posted at 08:39:14
おお、やっと公開へ!RT @aobeka: 横光利一「上海」の校了ファイルが、今、届いた。1935(昭和10)年の書物展望社版を底本とした、岩波文庫から。入れてくれた野口さん、校正の門田さん、小林さん。長大な作品、お疲れさまでした。 #aozorabunko posted at 22:47:04
忘れてた。RT @aobeka: こんな日に、青空文庫の作品が、1万に達した。 http://tinyurl.com/4p7576m 明日も、四作公開する。明後日は、一つ。明々後日も一つ。社会の片隅に育んだちっぽけな歯車は、何があってもまわす。 #aozorabunko posted at 18:19:40
Web上に展開して行くのも一つの方向。RT @satokazzz: 今起きた。昨晩「えあ草紙」を地味に公開しましたのでお試しください。次は本文の特定箇所にリンクしたりツイートできるようにする予定。 http://goo.gl/vwIdq #aozorabunko #denshi posted at 09:11:30
いろいろありがとうございました。RT @2SC1815J: 青空文庫の書誌情報CSV拡充版が暫定公開開始。GAEに取り込んで独自のAPIを提供することも、様々な新しい切り口で青空文庫を楽しむサービスを作成すること http://bit.ly/ewjvKu #aozorabunko posted at 11:20:37
こちらも地道に増えています。 RT @mie8: 片岡義男『波乗りの島』(1998年の改訂版)を公開しました。青空文庫です。ハワイ四部作完了!http://bit.ly/g8EC5S #aozorabunko posted at 11:30:05 素晴らしい!豊平文庫さん、ありがとうございます。RT @aobeka: 豊平文庫新版が、漢文の返り点と送り仮名に対応した。青空文庫の利用価値を世に知らしめてくれたiPhone/iPod用リーダーだが、訓点については、無視したり、当該箇所で組みが乱れたりで #aozorabunko posted at 11:26:17
それがいいですね。RT @aobeka: ウィキペディアの青空文庫の項目で、Sony ReaderやKindleからの利用について、案内すると良いかな。まずは、見出しとリンクだけでも。それと表示ソフトへも。Wikiへの、情報持ち寄りの方が、長期的に長持ち #aozorabunko posted at 09:47:04
OCRのソフトにはそれぞれ癖があるような気がするんですよね。一番良いのはそのOCRをフルに使いこなして、よく間違う文字をOCRを作ったソフト会社にフィードバックして、そういう文字を赤く表示させるようなものにしてくれるだけでも校正は楽ですね。 #aozorabunko posted at 09:47:59
岡本一平画著「一平漫画講座」を断裁してからScanSnapでPDF化して、付いてきたOCRソフト「ABBYY FineReader for ScanSnap」でテキスト化してみた。ABBYYという会社は聞いたことがなかったけど識字率は悪くなかった。 #aozorabunko posted at 20:18:32
KQコンビにはいつも頭がさがります。ごくろうさまです。 RT @aobeka: 国枝史郎「神州纐纈城」が、今日の青空文庫公開作品です。 http://tinyurl.com/253jow8 入力の小林さん、門田さん、校正の六郷さん。 #aozorabunko posted at 08:25:43
BitTorrentあたりに置いたりするのが良いのでしょうけど。でもBitTorrentって不正ファイルの温床だったりしてあまり良いイメージではないですね。RT @aobeka: 青空文庫丸ごとをダウンロードできるとよいのでしょうね。 @ThinTube #aozorabunko posted at 22:56:53
まだ変なところもありますね。でも今後に期待。RT @aobeka: 新しい試み。 #aozorabunko QT @ThinTube 青空文庫の底本をAmazonから探すサービスをGoogle App Engine上に作ってみたですよ。http://bit.ly/akLmlF posted at 01:33:29
むかし、芥川の「戯作三昧」でお見かけしたような。私は懐かしい!RT @aobeka: 牧逸馬「運命のSOS」(「世界怪奇実話Ⅰ」桃源社1969(昭和44)年10月1日)で、「てへん+発」に再会する。海野十三「西湖の屍人」以来の模様。別に懐かしくもなし。 #aozorabunko posted at 11:41:32
横光利一「上海」のOCR入力校正がやっと259/312ページ終了。やっとここまで来た。もうヨレヨレでゴールに向かってる。気が付くと上海万博は10/31で閉幕。公約不履行。 #aozorabunko posted at 22:57:40
ここのところずっと、数多くの人がTweetしてる。やっぱり、このジャンルが求められてる。: 青空文庫で読める日本古典SF http://bit.ly/a83RUz #aozorabunko posted at 12:24:57
海野十三というと、すったもんだがあった「海野十三敗戦日記」の公開が思い出深いです。作業中が残り3つと言うと、だいたいコンプリートに近いのかな。 #aozorabunko posted at 17:40:17
そうだった。とすると青空文庫のテキストファイルって、面白い位置に存在してる。 RT @satokazzz: もしくは直接ビューワーで表示するかですね。 RT @agtc: 青空文庫のテキストファイルはXHTMLファイルを生成する上での中間ファイルのような #aozorabunko posted at 12:58:10 青空文庫のテキストファイルはXHTMLファイルを生成する上での中間ファイルのような役割を担って行くんでしょうね。 RT @satokazzz: ソースを直接読む人も少ないでしょうし。 #aozorabunko posted at 12:47:56
今考えれば青空文庫の注記は開始/終了型にするのがベストでした。でも当初は、なるべくテキストを汚さない、という配慮が優先事項になっていたような気がします。テキストデータはなるべく無駄な情報のない方が望ましいけど、現状ではそれも捨てないといけないのでしょう。 #aozorabunko posted at 09:16:44
おお、素晴らしいRT @aobeka: 青空文庫APIを作った人がいる、と教えてもらいました。 http://tinyurl.com/3ygpory 素晴らしい!ぱっとみて、思ったことをメモしました。 http://tinyurl.com/2ej36qr #aozorabunko posted at 14:43:34
その点、ダイソーの人は最初からその意識がありましたよね。紙の本のことですけど。残念ながらペイできるくらいの数は売れなかった。RT @aobeka: 電子書籍に乗り出すとき、とりあえずタダということで、青空文庫の著作権切れが使われることがある。 #aozorabunko posted at 16:53:14
青空文庫API、なんとか実現したいです“@2SC1815J: 青空文庫API、PORTAやCiNiiのAPIを参考に、OpenSearchに対応すると使い勝手が良さそう。 http://bit.ly/cpH469 http://bit.ly/aTMSb #aozorabunko” posted at 14:38:08
「会社」が「会杜」になっているのはOCR認識で良くある間違えのパターン。一括変換ですべて直す。 #aozorabunko posted at 22:57:40 ワールドカップがあったりしてまったく進んでいない横光利一「上海」の入力作業。やっと気分が上向いて再開。198/312ページ終了。こなんじゃ、上海万博も終わってしまう。 #aozorabunko posted at 22:53:27
青空文庫を取り巻く環境は、11年目から12年目の時も変わったような気がするんですが、12年目から13年目の時のほうがもっと劇的でした。 RT @aobeka: 7月7日は、青空文庫の誕生日。今日で満13歳になりました。 #aozorabunko posted at 10:51:14
今日青空文庫で公開された折口信夫「国文学の発生(第四稿)」をi文庫HDで見ると、訓点送り仮名の[#(ノ)]が消えてしまっていた。返り点の[#一]や[#二]も注釈書きのまま表示されてしまってる。この辺りがレイアウトされると完璧なんですけど…。 #aozorabunko posted at 19:52:48
一つの方法ではありますよね。 RT @uakira2: 新しく入力するテキストについて底本を巧く選べば、イケると思ってます。 http://bit.ly/doPnVk RT @2SC1815J 青空文庫、底本のスキャン画像と仮公開、誤植の確認ができる。 #aozorabunko posted at 20:53:25
若干、私もそちらに傾いているんですが、OCRの取りっぱなし(つまり誤植が多い)のようなものもあるので、となると同一性保持権の軽視みたいな議論になるんですよね。 RT @2SC1815J: あくまで作業中のものと明示して「校正求ム」というスタンスで仮公開 #aozorabunko posted at 17:58:50 簡便な校正システムというものをいつも思い描くけど、いろいろな問題があって全然前進しないんですよね。日本語にうるさい人が多いというのも一つの壁。 #aozorabunko posted at 16:59:20 @kuzanさんの「うわづら文庫」のように「「版権」にも鑑み、著者の死後50年だけではなく、刊行後50年(団体名義の著作権の公表後50年になぞらえました)を経過したものを載せます」くらいにすればOKだろうけど、それではだいぶ限られた本だけになってしまう。 #aozorabunko posted at 14:44:30 底本のスキャン画像を公開することがだいぶグレーな行為になってしまうのが難しいところですね。 RT @2SC1815J: 青空文庫、入力済み・校正待ちのものが約2000作品。これらも底本のスキャン画像とともに仮公開してくれれば、誰でも誤植の確認ができる。 #aozorabunko posted at 14:39:38
で、横光利一「上海」のOCR入力の校正は、150/312ページが終了。やっと半分くらいかあ。結局、上海万博も開幕してしまったし。うぅ、閉幕までは何とか。 #aozorabunko posted at 23:38:21 GWはなるべく作業をしようということで、片岡さんの「頬よせてホノルル」の自分の担当の2章分を校了。でも、「三津子」の一つが「道子」になっていたのを最後まで気づかず。こんな大きな間違えを危うくスルーするところだった。 #aozorabunko posted at 23:31:45
そうなんですよね、iPadでのxhtmlの縦書きリーダーが欲しいんです。iPad版azurを切望。ほんとに、冗談じゃなくて、お願いしたいです。 #aozorabunko posted at 22:05:48 目次がつくと、書籍のような体裁にはなってくる。: 三好十郎 地熱 http://bit.ly/bHRNQA #aozorabunko posted at 19:58:28 RT @aobeka: 青空文庫XHTMLの目次生成用contents.jsは、注記一覧からdl可。現行版の把握済み問題点。/階層を作るにあたって、親の存在を前提としており、まず中がきて大といった逆転パターンで誤動作。/外字画像非表示。/IEで動かない。 #aozorabunko posted at 19:53:00
それは、あればいいなあ、と思ったことがありますね。 RT @satokazzz: 誰でも使えるような蔵書リスト公開フォーマット(RSS/ATOMのような)を青空文庫で定義して欲しい。これに文書フォーマットが合わされば、個人サイトなどもURLをビューワーに #aozorabunko posted at 12:28:09
「縦書き文庫」は美しいですね。 http://bit.ly/89tQBB RT @aobeka: JavaScriptによる、縦組にも対応した表示エンジン「涅槃」の紹介を、縦書き文庫さんからいただきました。 http://bit.ly/d1cfOF #aozorabunko posted at 09:48:50
|
last update 05/28 23:31
ツイート検索
Recent
Archives
Friends
Hashtags
Stats・Feed |