２ちゃんねる ■掲示板に戻る■ 全部 1- 最新50

■ このスレッドは過去ログ倉庫に格納されています

Linux対応のスキャナとOCR

1 ：揖保次郎：2006/08/23(水) 14:41:00 ID:hvIq0cZe.net: 語ってください。
2 ：login:Penguin：2006/08/23(水) 15:20:06 ID:yQ0uk8S8.net: Linuxで使えるプリンタ／スキャナ
http://pc8.2ch.net/test/read.cgi/printer/1133548494/
プリンタの設定ができずに困っている人々
http://pc8.2ch.net/test/read.cgi/linux/1029898072/
3 ：login:Penguin：2006/08/23(水) 17:09:23 ID:bY5+tAvL.net: 日本語OCR　激しく欲する
4 ：login:Penguin：2006/08/24(木) 00:28:06 ID:7+bi93gK.net: 日本語OCR　無いの？
5 ：login:Penguin：2006/08/24(木) 04:56:28 ID:A5+loJM+.net: オープンソースのOCRは、まだアルファベットの精度も厳しい状態らしいもんなぁ。
こういう分野こそIPAにしてほしいよ。
6 ：login:Penguin：2006/08/25(金) 10:40:46 ID:DWIi4Hyn.net: オープンソースじゃなくてもいいから
PDFファイルに日本語OCRをして透明テキスト追加ができれば　
多少値段が張っても買う
7 ：login:Penguin：2006/08/25(金) 10:50:22 ID:C36iItf5.net: ソースネクストにお願いして発売してもらおう。
8 ：login:Penguin：2006/08/25(金) 11:10:29 ID:U0qISCE5.net: パクリ元が無いからソースネクストじゃ無理だろw
9 ：login:Penguin：2006/08/26(土) 01:27:15 ID:miR2y+yn.net: ocrの認識エンジンってやっぱり複雑なの？
フリーソフトの域じゃ無理かねぇ。
10 ：login:Penguin：2006/08/26(土) 08:27:19 ID:ZmML8ibz.net: >7
ttp://www.google.co.jp/search?sourceid=navclient&hl=ja&ie=UTF-8&rls=GGLG,GGLG:2005-39,GGLG:ja&q=SmartOCR

複雑さつーか、ノウハウそのものがやたら知られてる訳じゃないような。
関連特許も多そうだし。
ttp://www.hino.meisei-u.ac.jp/ee/shima/index.files/shima_Patent.html
11 ：login:Penguin：2006/08/26(土) 20:33:30 ID:dwfRadz0.net: OCRATが良さそうですな。
12 ：login:Penguin：2006/08/27(日) 01:07:34 ID:XnlG/nuS.net: 日本語OCRを誰かさっさと作りやがれ！！
13 ：login:Penguin：2006/08/27(日) 22:04:54 ID:WSpPhjmG.net: よーし、パパがんばっちゃおうかな！！

・・・無理っす。
14 ：login:Penguin：2006/08/28(月) 04:41:34 ID:/rIGCUJQ.net: 今までの方式を再現するより、CPUとメモリを贅沢に使うことを前提に
愚直なアルゴリズムを実装したほうがうまくいくような気がする。
15 ：login:Penguin：2006/08/28(月) 13:57:48 ID:Cii6mITO.net: >>14
kwsk
16 ：login:Penguin：2006/08/28(月) 14:07:22 ID:wgvNCbYv.net: >>15
それが人にものを頼む態度か。
17 ：login:Penguin：2006/08/28(月) 18:30:02 ID:pZ8sjrgd.net: >>14
くわしく
18 ：login:Penguin：2006/08/30(水) 22:45:40 ID:X4WHCARr.net: ocrﾎｼｽorz
19 ：login:Penguin：2006/09/06(水) 21:49:26 ID:jkmQpdl3.net: HPが開発した“お蔵入り”OCRエンジンをGoogleがオープンソースで公開
ttp://opentechpress.jp/article.pl?sid=06/09/06/0958244
20 ：login:Penguin：2006/09/08(金) 18:16:07 ID:5bJPLsfP.net: 移植よろ
21 ：login:Penguin：2006/09/11(月) 10:22:46 ID:xHe91vNj.net: OCR無いんじゃ、メインマシンとして使えんがな。
22 ：login:Penguin：2006/09/16(土) 16:58:12 ID:eUS5Q2ff.net: 漏れはOCR使いたいから、Winとデュアルブートにしてる。
23 ：login:Penguin：2006/09/18(月) 18:43:40 ID:7ToA0imS.net: 奈良先端大の図書室にはｽｷｬﾅｰがあるようですね
今月のUNIXﾏｶﾞにでてましたけど
OCRはWinっぽいです

PDF化してDBに突っ込むのかな？
ぱっと見なんで読んでないですｗ

Epsonは作ってくれないのかねぇ～（ソフトは別会社か）
24 ：login:Penguin：2006/09/27(水) 17:58:45 ID:Zq3CHTMG.net: さっさと移植しろよ、ｺﾞﾙｧ
25 ：login:Penguin：2006/10/01(日) 11:00:12 ID:kLQrO3Nn.net: スレッド保守カキコ。

所有スキャナ
GT-9700F
26 ：login:Penguin：2006/10/01(日) 11:51:26 ID:30sZhVt8.net: >>19
CentOS4.4に入れてみた。見事にハングする。
BTSにFC3で死ぬって書いてあるから同じなんだろうな。
27 ：login:Penguin：2006/10/09(月) 11:30:01 ID:EQ4tTA39.net: 昔gocrとかあったなぁ・・・

・文章領域推定
・背景分離
・文字認識

がOCRの基本３技術だと思うけど、それぞれどんな感じなの？
いま問題になっているのはどこ？
28 ：login:Penguin：2006/10/10(火) 00:55:22 ID:/MdRGZUp.net: 日本語の文字認識って、特に難しいんだと思う。
一とーとか、二とニとか、しとレとか、Winでもできの悪いOCRだとボロボロになる。
29 ：login:Penguin：2006/10/10(火) 08:43:46 ID:6vSOB/G9.net: wineでエミュできるまともな日本語OCRってあったら教えてたもれ。
30 ：login:Penguin：2006/10/11(水) 00:06:24 ID:GUwJsB4T.net: Windows使えよ
31 ：login:Penguin：2006/10/11(水) 22:45:22 ID:eHaLTgt8.net: >>30
てめーが使ってろ
32 ：login:Penguin：2006/10/11(水) 23:24:23 ID:XMU6af3T.net: OMRONがOmCRでも移植してくれればなぁ。
33 ：login:Penguin：2006/10/13(金) 23:14:26 ID:IxIqTAt3.net: オ、オムロンって血圧計の・・・・？
34 ：login:Penguin：2006/10/13(金) 23:58:40 ID:yGdobEUM.net: それ以外にオムロンってある？
35 ：login:Penguin：2006/10/14(土) 00:05:57 ID:kwHyu9D6.net: >>33
自動改札だってオムロンだろう。

学生で企業の産業分野BUは見えないにしてもプロジェクトX位見てるだろう？
36 ：login:Penguin：2006/10/17(火) 08:39:43 ID:cjTANUii.net: 自動改札みたいな組み込み出さなくても、
オムロンソフトウェアは翻訳魂とかLinux用の
パッケージソフトをいくつか出してたんだが。

うちでは今でも現役だぞ。> 翻訳魂
37 ：login:Penguin：2006/10/18(水) 01:27:36 ID:KSkySP//.net: 電動工具のリョービがなんでフォント売ってんだよっていう疑問もある。
38 ：login:Penguin：2006/10/18(水) 01:46:10 ID:4XMd0OBj.net: 釣具も売ってるよ！
39 ：login:Penguin：2006/10/18(水) 02:42:49 ID:yMNr6nz8.net: 俺にとってオムロンはモデムだった
40 ：login:Penguin：2006/10/18(水) 10:56:53 ID:B+acluru.net: >>38
釣具部門はもう売られただろ、確か。
41 ：login:Penguin：2006/10/18(水) 15:23:26 ID:KSkySP//.net: 釣具はやっぱりシマノ
42 ：login:Penguin：2006/10/19(木) 02:09:15 ID:Ew7MVMXK.net: オムロンは音声合成もやっとるよ～
43 ：login:Penguin：2006/10/19(木) 16:12:04 ID:iGPaBe3g.net: こんな自信のあるやつみたことない、、、、
　　↓↓↓↓↓↓↓↓↓↓↓↓↓↓
http://heisasimasita.blog.shinobi.jp/
44 ：login:Penguin：2006/10/19(木) 17:05:06 ID:yx3VVHaw.net: 閉鎖ってなってるよ
45 ：login:Penguin：2006/10/25(水) 15:22:56 ID:song7LzM.net: そろそろ有志による開発が始まろうとしている
46 ：login:Penguin：2006/11/01(水) 00:56:06 ID:TnbB/mJb.net: mac対応ソフトはあるのに
47 ：login:Penguin：2006/11/08(水) 20:00:46 ID:kIH4bHzY.net: ocrってなんの略？
48 ：login:Penguin：2006/11/08(水) 20:03:26 ID:wl557VXU.net: >>47
http://linux2ch.is.land.to/index.php?OnlineDictionaries
49 ：login:Penguin：2006/11/08(水) 20:10:08 ID:3+jIV1tj.net: OぷてぃCaRu
50 ：login:Penguin：2006/11/09(木) 23:54:13 ID:MOxl8Jmh.net: OnlineChineseRelationship
51 ：login:Penguin：2006/11/17(金) 00:30:52 ID:Kke65Bue.net: i am chicken.
52 ：login:Penguin：2006/11/29(水) 21:58:11 ID:HNwoVyRZ.net: Ｏ・Ｃ・Ｒ！
Ｏ・Ｃ・Ｒ！
53 ：login:Penguin：2006/12/12(火) 21:57:49 ID:YIMQLrAk.net: 読んでココ！
54 ：login:Penguin：2006/12/13(水) 23:38:11 ID:BhCrulAE.net: だが断る
55 ：login:Penguin：2006/12/21(木) 19:28:28 ID:nxUBfYGz.net: なあに、かえって免疫力がつく。
56 ：login:Penguin：2007/07/31(火) 11:55:25 ID:65rFl0Pu.net: 誰か開発しろって言ってるだろ、ボケがぁ！！
57 ：login:Penguin：2007/07/31(火) 14:00:48 ID:+viK+L6G.net: 欧米語用だけど、ocradはほぼ100%の認識で便利に使えた
最適なdpiを探るのにちょっと時間がかかったけど

日本語用のOCRを激しく希望
58 ：login:Penguin：2007/08/20(月) 17:30:54 ID:sNtfpeym.net: Wineで使えるか試してみよう。そうしよう。
59 ：login:Penguin：2007/08/22(水) 03:23:21 ID:aaNrdmsM.net: ウチのスキャナはxsaneが対応してないす・・・
60 ：login:Penguin：2007/08/22(水) 07:43:03 ID:GUTMrRDo.net: >>59
それはMSの陰謀だからxsaneが悪いわけじゃないし、普及すれば良くなるよ。
61 ：!(ФｙФ+){ 私は孔酔 }：2007/08/22(水) 10:30:29 ID:pnn4/ZUJ.net: >>56『追加』/debian-base.で個人使用、OS.の開発を考えて居るﾋﾟｮぞ¿...ｺﾁﾗｵﾝｼﾝﾌﾂｳﾃﾞｽ…
62 ：!(ФｙФ+){ 私は孔酔 }：2007/08/22(水) 10:33:04 ID:pnn4/ZUJ.net: 　　　　 ,..♪
　ヾi、ヽ.i
　(,.ф ￠ф)　 зξι　ﾋﾟｮﾋﾟｮっと
　ミ,.＇.ノ
/￣″￣　・・・>>61『追加』/嗚呼¿...ｺﾉｽﾚﾆｶﾝｹｲﾅｶｯﾀｶ+ｺﾁﾗｵﾝｼﾝﾌﾂｳﾃﾞｽ
63 ：login:Penguin：2007/09/06(木) 11:20:11 ID:Fb0o2EnQ.net: 期待してきたスレなのに過疎ってるなぁ。

tesseract使ってみた。(HP起源ののGoogle系)
俺の場合はocradより精度よかった。
ただ、数字しか用事ないんだけど3を5と勘違いする確率が高い。
トレーニングすることで精度上がるみたいだけど、
だれかやったことある人いたら教えて。
TrainingTesseract - tesseract-ocr - Google Code
http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract
64 ：login:Penguin：2007/10/08(月) 12:00:45 ID:HruXyoxa.net: にぽんごがつかえないとイミないヨ
65 ：login:Penguin：2007/10/08(月) 12:59:47 ID:tb1zM/Lh.net: 日本語ocr
orz
66 ：login:Penguin：2008/01/12(土) 21:00:06 ID:USJU18tI.net: orz
67 ：login:Penguin：2008/01/20(日) 00:17:49 ID:EQfjQT28.net: VMWareでゲイツOS動かして（ry
68 ：login:Penguin：2008/03/05(水) 17:32:20 ID:m5WO5cfN.net: ド素人が
ＳＣＳＩ接続のスキャナーを
にんしきさせるのは
むずかしいですか？
69 ：login:Penguin：2008/03/09(日) 19:24:23 ID:WzCSxsqB.net: DVD番KNOPPIXで起動してgimp起動してみる。
運よければ認識する。
70 ：login:Penguin：2008/03/10(月) 10:37:37 ID:NCtKpYso.net: >>68
昔はUSB接続のスキャナよりもSCSI接続の方が遙かに簡単だったけど。
71 ：login:Penguin：2008/03/10(月) 17:23:48 ID:I068eTmS.net: saneでサポートされている機種ならなんにもしなくて認識すると思う。
サポートされてない機種は難しい。
USBでもSCSIで同じだと思う。
72 ：login:Penguin：2008/07/05(土) 10:00:21 ID:p3OIquvj.net: まだあったのか、このスレ・・・
73 ：login:Penguin：2008/07/06(日) 18:27:56 ID:4bK5eKwt.net: fedora core 8 に入っているデバイスドライバで対応しているスキャナの一覧知りたい
74 ：login:Penguin：2008/07/06(日) 18:40:14 ID:yDT04Lsw.net: エプソンの古いスキャナはエプソンコーワがドライバを出してたので
相性が良さそうに思う。
それ以外はお金払ってVueScanを使うとよいと思う。
こいつのおかげで拾ってきたフィルムスキャナが使えて大喜び。
75 ：login:Penguin：2008/07/08(火) 22:48:57 ID:h8Fjavx+.net: >>73
http://www.sane-project.org/sane-mfgs.html
おおよそこれ
FC8には入ってなくて上の一覧にあったら自前でコンパイル
FC8ならまだアップデート来るだろうけど
76 ：login:Penguin：2008/07/27(日) 17:31:45 ID:rGVms7pG.net: 　　　　　　　http:// ; ?????????
　　　　　http:// ; 　????????????
http://?;??????????? ?　　　　　??
http://?;?????????? 　?　　　　　　??
http://?;?■??■?　　?　　　　　 ? 　?
　　　　　　　　　　 ▲?? 　　　　　? ???
　　　　　　　　　　?? ?????　 ???? ??
　　　　　　　　　　　?▲ ?　??　???
　　　　　　　　　????? ???▲?
　　　　　　　　????　??? 　??　????????
http:// ;?????????　?　　　??????? 　　　 ??
http://?;?????? ???　　　　　　?　　　　　 ???
http:// ???　??????　　　　???　　　 ???　???
http://?;???????? ????　　?　???　　?　??▼
http://?;??????? 　　? 　　 ???　　　　?　 ??
77 ：login:Penguin：2008/08/07(木) 22:26:27 ID:G7yV4hjq.net: とりあえずこれだけは言える。
俺の人生にはいいことはなかったし、これからもない。
78 ：login:Penguin：2008/11/28(金) 20:30:26 ID:U80ZIjo0.net: Linuxは普及しないと思いました。
79 ：login:Penguin：2009/05/18(月) 13:30:25 ID:32LxwiHT.net: http://sourceforge.jp/forum/forum.php?forum_id=18640

NHocrのソースコードを初公開 (ver 0.16(beta))
投稿者: hgot
日付: 2009-05-15 18:56
日本語文字認識プログラムNHocrのソースコードを初公開しました (ver 0.16(beta))。
Solaris SPARC/x86, Linux (x86_64)上で動作確認済みです。OCRopusからの呼び出し
が可能です。文字行認識部がライブラリ化されており、自作プログラムからの利用も
容易です。
80 ：login:Penguin：2009/05/18(月) 19:38:05 ID:nm2XA63v.net: OCRって使わないほうがいいのかなと最近思う。
認識ミスはかならず起こるから、結局人間の目で検査することになるよね。
ところが似たような形ゆえに誤認識してるわけだから間違い探しが大変。
81 ：login:Penguin：2009/05/19(火) 15:20:55 ID:hQEejHMo.net: スキャン→OCR→青空文庫テキスト化のノウハウをまとめた文章があってそれによれば
誤認識しやすい文字はエディタで文字色を変えて検査するとかの方法があるらしい

誤認識しやすい文字は
ttp://www.siesta.co.jp/aozora/archives/002740.html
82 ：login:Penguin：2009/05/19(火) 22:47:05 ID:VdrLajQJ.net: >>79
これいいですね。
試しに使ってみましたが、Windowsで認識率No.1を誇る本格読取の約200倍の
認識精度でした。
取り扱いも容易だし、このためだけにLinuxを導入する場合も出てくるのでは
ないでしょうか？
キラーアプリと言って差し支えないと思います。
83 ：login:Penguin：2009/05/28(木) 21:09:32 ID:1fSWwA3J.net: >>82
つまり、本当は、使い物にならないレベルってこと？
84 ：login:Penguin：2009/06/25(木) 09:41:47 ID:hXpPfq+7.net: 市販品には勝てんな。
85 ：login:Penguin：2009/07/05(日) 07:38:52 ID:p3XE0Qtt.net: >>81
市販のに追いつくのは無理だと思う。
86 ：login:Penguin：2009/07/05(日) 09:47:22 ID:J147l0Qp.net: 自分で作るしかないな。
87 ：login:Penguin：2009/07/08(水) 08:29:23 ID:MYN3KcvK.net: >>85
学習が進むと市販製品より3桁精度が上がるぞ。
88 ：login:Penguin：2011/05/24(火) 21:23:27.29 ID:YUPTZaFr.net: 自炊を前提にした一括スキャン・PDF化はLinuxじゃできないのか…
本1冊くらいなら根性で何とかなりそうだが、
本棚まるまる自炊は現実的じゃなさそうだな
89 ：login:Penguin：2011/05/25(水) 18:39:39.14 ID:n6vorquV.net: 読取革命のOCRはWineで動いたよ。
スキャナからの直接読み取りはできないし、メニューも文字化けしたけど。
Linux側のスキャンソフトでスキャンしたあと、読取革命にシェルスクリプトで
渡せそうな気もするが、そこまで試してはいないけどね。
90 ：login:Penguin：2011/05/27(金) 20:06:04.78 ID:U9X/yOF+.net: Googleが開発してるやつが日本語対応してるよ。
91 ：login:Penguin：2011/06/03(金) 20:26:04.94 ID:vne5pZaw.net: DR-150のドライバの更新まだー
92 ：login:Penguin：2011/06/06(月) 10:04:34.57 ID:f+eQwx5N.net: >>91
昔saneの作者宛てに実機送れ(寄贈)ばドライバ書いてくれるって見たことがある。
送ってみれば？
93 ：login:Penguin：2011/06/12(日) 11:46:55.78 ID:DcUUeU9g.net: >>92
いっぱい送られてきたら作者は邪魔じゃないのか
着払いで送り返してもらった方が、お互い幸せなんじゃないか
94 ：login:Penguin：2011/10/08(土) 06:08:04.09 ID:fjbb6eBR.net: gscan2pdfのOCR機能をtesseract-ocrで日本語認識できるようにしてみた

以下いい加減なパッチ

*** gscan2pdf 2011-10-08 05:36:43.218863368 +0900
--- /home/pcadmin/デスクトップ/gscan2pdf 2010-08-11 17:39:58.000000000 +0900
***************
*** 153,159 ****
use Archive::Tar; # For session files
use Sane;
use PDF::API2;
- use PDF::API2::Resource::CIDFont::CJKFont;
use Getopt::Long;
use
Set::IntSpan 1.10; # For page numbering issues. 1.10 required for size method
--- 153,158 ----
***************
*** 223,229 ****

# Set LC_NUMERIC to C to prevent decimal commas (or anything else) confusing
# scanimage
! setlocale( LC_NUMERIC, "ja_JP.UTF-8" );
if ($debug) {
print "Using ", setlocale(LC_CTYPE), " locale\n";
print "Startup LC_NUMERIC ", setlocale(LC_NUMERIC), "\n";
95 ：login:Penguin：2011/10/08(土) 06:09:10.41 ID:fjbb6eBR.net: 逆だった

*** /home/pcadmin/デスクトップ/gscan2pdf 2010-08-11 17:39:58.000000000 +0900
--- gscan2pdf 2011-10-08 05:36:43.218863368 +0900
***************
*** 153,158 ****
--- 153,159 ----
use Archive::Tar; # For session files
use Sane;
use PDF::API2;
+ use PDF::API2::Resource::CIDFont::CJKFont;
use Getopt::Long;
use
Set::IntSpan 1.10; # For page numbering issues. 1.10 required for size method
***************
*** 222,228 ****

# Set LC_NUMERIC to C to prevent decimal commas (or anything else) confusing
# scanimage
! setlocale( LC_NUMERIC, "C" );
if ($debug) {
print "Using ", setlocale(LC_CTYPE), " locale\n";
print "Startup LC_NUMERIC ", setlocale(LC_NUMERIC), "\n";
96 ：login:Penguin：2011/10/08(土) 06:13:28.92 ID:fjbb6eBR.net: ***************
*** 2730,2735 ****
--- 2731,2737 ----
send( $parent, '0' . $d->get('Setting up PDF'), 0 );
my $pdf = PDF::API2->new( -file => $filename );
$pdf->info( get_PDF_options() );
+ $pdf->cjkfont('KozMin');

foreach (@pagelist) {
++$page;
***************
*** 2854,2860 ****
# Add OCR as text behind the scan
if ( defined( $slist->{data}[$_][3] ) ) {
print "Embedding OCR output behind image\n" if $debug;
! my $font = $pdf->corefont('Times-Roman');
my $text = $page->text;
my $canvas = $slist->{data}[$_][3];
my $root = $canvas->get_root_item;
97 ：login:Penguin：2011/10/08(土) 06:15:54.11 ID:fjbb6eBR.net: --- 2856,2863 ----
# Add OCR as text behind the scan
if ( defined( $slist->{data}[$_][3] ) ) {
print "Embedding OCR output behind image\n" if $debug;
! # my $font = $pdf->corefont('Times-Roman');
! my $font = $pdf->cjkfont('KozMin');
my $text = $page->text;
my $canvas = $slist->{data}[$_][3];
my $root = $canvas->get_root_item;
***************
*** 11073,11079 ****
$cmd = "$pre tesseract $tif $txt -l $SETTING{'ocr language'}$post";
}
else {
! $cmd = "$pre tesseract $tif $txt$post";
}
}
elsif ( $SETTING{'ocr engine'} eq 'ocropus' ) {
98 ：login:Penguin：2011/10/08(土) 06:30:52.63 ID:fjbb6eBR.net: --- 11076,11082 ----
$cmd = "$pre tesseract $tif $txt -l $SETTING{'ocr language'}$post";
}
else {
! $cmd = "$pre tesseract $tif $txt -l jpn $post";
}
}
elsif ( $SETTING{'ocr engine'} eq 'ocropus' ) {
***************
*** 11278,11283 ****
--- 11281,11287 ----
deu => $d->get('German'),
'deu-f' => $d->get('German (Fraktur)'),
eng => $d->get('English'),
+ jpn => $d->get('Japanese'),
fra => $d->get('French'),
ita => $d->get('Italian'),
nld => $d->get('Dutch'),
99 ：login:Penguin：2011/10/08(土) 06:34:32.56 ID:fjbb6eBR.net: ***************
*** 11318,11324 ****
}

# If there are no language files, then we have tesseract-1.0, i.e. English
! push @tesslang, [ undef, $d->get('English') ] if ( !@tesslang );

my $combobox = combobox_from_array(@tesslang);
combobox_set_active( $combobox, $SETTING{'ocr language'}, @tesslang );
--- 11322,11328 ----
}

# If there are no language files, then we have tesseract-1.0, i.e. English
! push @tesslang, [ undef, $d->get('Japanese') ] if ( !@tesslang );

my $combobox = combobox_from_array(@tesslang);
combobox_set_active( $combobox, $SETTING{'ocr language'}, @tesslang );
100 ：login:Penguin：2011/10/08(土) 06:36:49.66 ID:fjbb6eBR.net: ***************
*** 11343,11348 ****
--- 11347,11353 ----
fra => $d->get('French'),
rus => $d->get('Russian'),
swe => $d->get('Swedish'),
+ jpn => $d->get('Japanese'),
spa => $d->get('Spanish'),
ita => $d->get('Italian'),
ruseng => $d->get('Russian+English'),

以上。・・・ただし、OCRが使いものになると思ってはいけない・・・。
101 ：login:Penguin：2011/10/08(土) 06:40:59.20 ID:fjbb6eBR.net: いちおう上げとく
102 ：login:Penguin：2011/10/08(土) 21:34:22.49 ID:40C2TRhz.net: バイナリ欲しい
103 ：login:Penguin：2012/04/23(月) 15:36:03.51 ID:dZtzn7Vo.net: Mac用のTessOCR使えないかなJavaらしいが起動しないｗ
104 ：login:Penguin：2012/09/10(月) 01:59:55.28 ID:JMuNh7SD.net: ScanSnapS300をただで入手しちゃったから、いじってたんだけど
どうも、読み取り範囲の指定ができないみたい。
gscan2pdfで正常に読み取れないみたい(simplescanとかxsaneはOK)
ローラーの汚れと摩耗で傾くのはどうしようも無い。
けっこう雑誌の荒い紙は綺麗には読み込めない。

とか悩んでたんだけど、scantailorを使ってみたら、楽すぎてワロタ。
Linuxで自炊とかいうスレ立てたほうがいい?
105 ：login:Penguin：2012/09/10(月) 21:44:06.06 ID:Cno4X1Rj.net: 興味はあるがLinuxの自炊派人口はどのくらいいるのかねえ
ドキュメントスキャナの対応状況が調べてもほとんど見えてこなくて手を出せずにいる
106 ：login:Penguin：2012/09/11(火) 01:22:34.52 ID:0TSPUHH3.net: 同じく興味あるけどこのスレでいいんじゃないかって気も
107 ：104：2012/09/11(火) 19:54:30.28 ID:B9PNTbbM.net: 実際に、雑誌の誌面を100枚ほど処理してみたけど
scantailorの範囲選択が、自動まかせだと
おかしなことになることがある。
特に、周辺に余白の無い、広告ページとかアクションシーン。

傾き補正も、マンガではよくある。傾いた建物などで誤動作する。

全部自動任せでやるには
スキャン段階で、傾かず、位置ズレせず、が理想だな。やっぱり。
でも、中古スキャナーのADFで、傾かないってのは無理くさい。ローラー拭いたら緩和するけどね。

ちなみに、ScanSnapシリーズはファームウェアを
Windows用ドライバーから取り出す必要がある。うちはWine併用で導入。
一旦取り出してしまえば、dynabookAZでも、ScanSnapS300を動かせた。
まぁ、512MBしか無いARM機で、大仕事はできないけどね。

EP-901Aは片面しか読めないけど、何の手間もかからずにUbuntu12.04LTSで使えた。
ただ、さすがジャンク入手、不調で、端っこ5%くらいが読み取りできない orz
108 ：login:Penguin：2012/09/12(水) 11:30:02.70 ID:mwRLZ58X.net: ディストリビュータにより、差が出てくるな。
何と行っても、Ubuntu+hpのhp製スキャナー・プリンタ複合機、
この組み合わせ最強。
109 ：login:Penguin：2012/09/12(水) 21:52:07.10 ID:Ow49jEd9.net: いくら複合機の相性が良くても、自炊を全体に考えたら論外だからなあ
110 ：login:Penguin：2012/09/16(日) 23:18:33.92 ID:EFAP7Pzc.net: gscan2pdfって、もしかしてシングルスレッド?
4コアあるんだけど、負荷見ると、普通に1コアしか使っていないっぽい。

300ページくらいやってみたら、えらい時間かかる。

寝ている間に、scantailorの出力を終えて
今朝、起き抜けにPDFにしてみたんだけど、出勤時間までに終わらんかった orz

買ったばっかりの雑誌を持ち歩く手段としては、かなり厳しいなぁ。

総レス数 110
24 KB

掲示板に戻る全部前100 次100 最新50

read.cgi ver.24052200