CirQ
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[書庫保存]]
*CirQ サーク [#r59e51ba]
JH1FCZ大久保OMが発行していた機関誌です。
私は、時々見て楽しんでいましたが、いつのまにかサイトも閉...
私の保存してあるPDFをダウンロードするようにしました。
闇雲にDLLしても、沢山の量になってしまいますので、目次をテ...
下の画像は全て表示した画像です~
&ref(./cirq.png,30%);
下の写真は、検索に「アンテナ」と入れ検索した画像です~
&ref(./ant.png,30%);
***お願い [#v9a8a620]
バックナンバーが不足しています
お持ちの方がいましたらご連絡下さい
''欠番は、38、44、46、47、48、49、50、51、52、54〜65号''
***免責 [#i18f0572]
CirQ自体の著作権はJH1FCZ大久保OMに有ります。~
ダウンロードした本誌を勝手に改編することは堅くお断りしま...
元々ねっとで公開され、自由にDLLするようになっていましたの...
又、本サイトを使っての不具合などの責任については、当方は...
不具合報告や要望、希望等のご意見はメニュー{トップ」にあ...
***覚え書き 前準備 [#s49d6ed6]
サーバーにはPDFtoTEXTがインストールしてないので、前準備は...
適当にコードを直しながらコンパイル実行させれば数分で完了...
下記はそのソースコード 覚え書きだ
my @cirq_dir_list=glob($cirq_path."*.pdf"); ...
@cirq_dir_list = sort { $a cmp $b } @cirq_dir_list; ...
foreach my $fn(@cirq_dir_list){
`/usr/local/bin/pdftotext -f 1 -l 1 $fn; #pdftotext ...
}
foreach my $fn(@cirq_dir_list){
`/usr/local/bin/pdftotext -f 1 -l 1 $fn | head`; #pd...
print ("$fn\n");
}
#テキストの余分な改行を削除する
my @text_list=glob($cirq_path."*.txt");
foreach my $fn(@text_list){
my $fn3=$fn;
$fn3 =~ s/.txt/-1.txt/;
`gawk 'NF > 0' $fn > $fn3`;
print ("$fn\n");
}
整形したテキストファイルはCirQ¥d+-1.txt となる
又、スペースは邪魔なので削除し、改行は「。」に置き換えて...
この様にして1ページ目にある目次をテキスト化して表示に使...
目的のダウンロードは、左端のCirQnnnをクリックすればダウン...
まぁ、出来るだけ自動でテキスト化したのでおかしな箇所有り...
又、PDFgrepというコマンドもありますが、使うと沢山ヒットし...
まぁ、そのコマンドは、おおよその見当を付けてから使う方がF...
サイトは[[ここから>http://print-man.jp/~jr1gdy/cgi-local/...
終了行:
[[書庫保存]]
*CirQ サーク [#r59e51ba]
JH1FCZ大久保OMが発行していた機関誌です。
私は、時々見て楽しんでいましたが、いつのまにかサイトも閉...
私の保存してあるPDFをダウンロードするようにしました。
闇雲にDLLしても、沢山の量になってしまいますので、目次をテ...
下の画像は全て表示した画像です~
&ref(./cirq.png,30%);
下の写真は、検索に「アンテナ」と入れ検索した画像です~
&ref(./ant.png,30%);
***お願い [#v9a8a620]
バックナンバーが不足しています
お持ちの方がいましたらご連絡下さい
''欠番は、38、44、46、47、48、49、50、51、52、54〜65号''
***免責 [#i18f0572]
CirQ自体の著作権はJH1FCZ大久保OMに有ります。~
ダウンロードした本誌を勝手に改編することは堅くお断りしま...
元々ねっとで公開され、自由にDLLするようになっていましたの...
又、本サイトを使っての不具合などの責任については、当方は...
不具合報告や要望、希望等のご意見はメニュー{トップ」にあ...
***覚え書き 前準備 [#s49d6ed6]
サーバーにはPDFtoTEXTがインストールしてないので、前準備は...
適当にコードを直しながらコンパイル実行させれば数分で完了...
下記はそのソースコード 覚え書きだ
my @cirq_dir_list=glob($cirq_path."*.pdf"); ...
@cirq_dir_list = sort { $a cmp $b } @cirq_dir_list; ...
foreach my $fn(@cirq_dir_list){
`/usr/local/bin/pdftotext -f 1 -l 1 $fn; #pdftotext ...
}
foreach my $fn(@cirq_dir_list){
`/usr/local/bin/pdftotext -f 1 -l 1 $fn | head`; #pd...
print ("$fn\n");
}
#テキストの余分な改行を削除する
my @text_list=glob($cirq_path."*.txt");
foreach my $fn(@text_list){
my $fn3=$fn;
$fn3 =~ s/.txt/-1.txt/;
`gawk 'NF > 0' $fn > $fn3`;
print ("$fn\n");
}
整形したテキストファイルはCirQ¥d+-1.txt となる
又、スペースは邪魔なので削除し、改行は「。」に置き換えて...
この様にして1ページ目にある目次をテキスト化して表示に使...
目的のダウンロードは、左端のCirQnnnをクリックすればダウン...
まぁ、出来るだけ自動でテキスト化したのでおかしな箇所有り...
又、PDFgrepというコマンドもありますが、使うと沢山ヒットし...
まぁ、そのコマンドは、おおよその見当を付けてから使う方がF...
サイトは[[ここから>http://print-man.jp/~jr1gdy/cgi-local/...
ページ名: