K�ttan HTML 'e d�n���m i�in bir ara� zinciri

ArticleCategory: [Choisissez une categorie pour votre article dans la liste ci-dessous dans les cat�gories disponibles]

Applications

AuthorImage:[Nous avons besoin ici d'une petite image de vous]

[Photo of the Author]

TranslationInfo:[Mettez votre page personnelle ou votre adresse e-mail ici]

original in en Iznogood 

en to fr Iznogood

en to tr ONUR YILMAZ

AboutTheAuthor:[Une br�ve biographie de l'auteur]

Bir s�reli�ine GNU/Linux ile ilgilendim ve �u anda Debian sistemi kullan�yorum. Elektronik �al��malara ra�men; �o�unlukla, GNU/Linux toplulu�u i�in, bir Frans�zca �eviri �al��mas� yap�yorum.

Abstract:[Ecrivez ici un r�sum�]

Burada, bir geleneksel k�t dergiyi HTML 'e �evirmek i�in kullan�lan bir ara� zinciri anlat�lmaktad�r. Taramadan html bi�imine kadar olan s�reci a��klayaca��m.

ArticleIllustration:[Ceci pr�cise l'illustration qui apparaît au d�but de votre article]

[Illustration]

ArticleBody:[Le Corps de l'Article]

Giri�

Baz� US �niversitelerinin Google 'a, k�t�phanelerini dijitalle�tirmek (say�sal ortama aktarmak) i�in, yard�m edece�ini veya izin verece�ini okudum. Ben Google de�ilim ve bir �niversite k�t�phanem yok; fakat elektronik hakk�nda baz� eski k�t dergilerim var. Ve k�t kalitesi iyi de�il: Sayfalar i�e yaramaz hale gelmeye ba�lad�, grile�ti...
Daha sonra dijitalle�tirmeye karar verdim; ��nk� konular yakla��k olarak 10 y�l �nce kapanmas�na ra�men, baz� makaleler daima g�ncel!

Donan�m

Ba�lamak i�in, veriyi bilgisayara aktarmak gerekli. Bir taray�c� bana bunu yapmama izin verir: baz� uyumluluk denetimlerinden sonra bir taray�c� ald�m, kullan�lm�� fakat ucuz ScanJet 4300C. Ve biraz internet gezintisiyle, onu yap�land�rmak i�in gerekli ayarlar� buldum.
Debian 'da, sane, xsane, gocr ve gtk-ocr '� ola�an �ekliyle kurdum:

apt-get install sane xsane gocr gtk-ocr
root iken.

Sane ve xsane benim HP taray�c�m�n �al��mas� i�in gerekli olan taray�c� ara�lar�d�r.
Gocr ve gtk-ocr metine d�n��m�� bir g�r�nt� yapan ara�lard�r.

Taray�c� bir USB taray�c�:
sane-find-scanner
sonra baz� dosyalar� d�zenlemek i�in /etc/sane.d/ 'e gittim:
dll.conf i�inde, �unlar�
hp
niash
ve di�er her �eyi yorum konumundan ��kartt�m (sat�r ba�lar�ndaki # 'leri kald�rarak).

hp.conf ve niash.conf i�ine, �unlar� yazd�m:
/dev/usb/scanner0
option connect-device
ve di�er her �eyi yorum konumundan ��kartt�m.

Ayg�t dosyas�n�n /dev/usb/scanner gurup sahipli�ini �ununla de�i�tirdim
chgrp scanner scanner0
ve taray�c�y� root olmadan kullanabilmek i�in kullan�c� olarak iznogood 'u ekledim:
adduser iznogood scanner
Bir yeniden ba�latma ve tamamland�!

G�r�nt�leri depolamak i�in, DVD yaz�c�lar i� yapmaya yeterince ucuz, �rne�in bir NEC 3520. Eski bir �ekirde�im var (2.4.18) bu y�zden, IDE yak�c� SCSI arabirimini kullan�r:
modconf ile, ide-scsi 'yi y�klettim

ve /etc/lilo.conf 'a �unu ekledim:
append="hdb=ide-scsi ignore hdb"
sonra
 lilo
i�leme sokulmas� amac�yla.
/etc/fstab i�ine, �unu ekledim:
/dev/sdc0    /dvdrom     iso9660    user, noauto     0  0
Sonra scd0 gurubunu cdrom 'a de�i�tirdim
chgrp cdrom scd0
Olduk�a kolay.

Yaz�l�m

��leme devam etmek i�in, baz� yaz�l�mlara gereksinimim vard�:
sane, xsane, gimp, gocr, gtk-ocr, bir metin edit�r�, bir html edit�r� ve biraz disk alan�.

Sane taray�c� arka ucu (arka plan i�lerini yapan program veya program par�as�) ve xsane grafiksel �n u� (kullan�c� arabiriminden sorumlu olan program veya program par�as�).
Amac�m ��z�n�rl��� maksimum tutmak ve her sayfa i�in 50 MB bir dosya elde etmek, �zerinde �al��mak i�in bir sabitdiskte depolamak ve tamamland��� zaman, bir DVD-ROM �zerine saklamakt�.
��z�n�rl��� 600 dpi 'a getirdim, biraz daha parlakl�k verdim ve d�n��t�rmeye ba�lad�m. �ok eski bir bilgisayar oldu�undan (bir PII 350 MHz), biraz zaman ald� fakat iyi ve do�ru bir g�r�nt�ye sahip oldum. Onu png bi�iminde saklad�m.
Neden b�yle bir ��z�n�rl�k ve 50 MB dosya? Ar�iv ve ilerideki say�sal i�leme i�in ��z�n�rl��� maksimum tutmak istedim.
Gimp kullanarak sayfay� grafiksel g�r�nt�lere ve sadece taranm�� metin i�eren g�r�nt�lere kestim.
Grafikler, html sayfas�na uyacak �ekilde k���lt�lm�� boyutlarla, png olarak sakland� ve metin g�r�nt�leri k���lt�lmedi, ama renkliden gri ve tonlar�na d�n��t�r�ld� (Tools, Colors Tools, Threshold ve Ok) ve optik tan�ma yaz�l�m�yla i�lemek i�in .pcx uzant�s�yla sakland�.



Taranm�� g�r�nt�n�n tamam�n� sa� �stte ve kesik par�alar� solda g�rebilirsiniz.
Resmi keserken, ba�l�klar� kald�rabilirsiniz; ��nk� fazla alan i�gal ediyorlar ve gocr taraf�ndan tan�nmayacaklar.
G�r�nt�ler i�in bir ima alt dizini yarat�r�m ve .pcx dosyalar�ndan ay�r�r�m.

�imdi gtk-ocr zaman�, gocr �n ucu. gocr bir optik karakter tan�ma yaz�l�m�d�r. Kullanmas� �ok kolay: Sadece dosyalar� se�mem gerekir ve gtk-ocr her �eyi y�netir. Bana her i�lenmi� .pcx dosyas� i�in bir .txt dosyas� verdi.




Kolayl�kla
 cat *.txt > test.txt
bir test.txt 'te sahip oldum ve bir metin edit�r�yle baz� ayarlamalar yapmam gerekti. (frans�zca olmayan karakterler kald�r�ld�, s�zc�kler d�zeltildi...).

Html edit�r�ne bir Kopyala/Yap��t�r, benim i�in Mozilla Composer, ve html kompozisyonuna ba�lad�m (resimleri ekledi�iniz zaman sadece ili�kili ba�lant�lara (links) sahip oldu�unuza dikkat edin).


Bash betikleme

Gen�li�imde bana bu atas�z�n� s�yleyen, bir matematik ��retmenini daima hat�rlar�m:

"Tembel olmak i�in, zeki olman gerekir".

Tamam, tembel olmaya ba�lad�m !!!! ;-)
Kolayl�kla otomatikle�tirilmeyen baz� el yordam� gerektiren b�l�mler var (dizin yarat�lmas�, tarama, gimp 'te kesme bi�me ve dosya yarat�lmas�). Geri kalan�n� otomatikle�tirebilirsiniz.
Bash betikleme hakk�nda inan�lmaz bir �ngilizce ��retici var, ABS (Advanced Bash Scripting Guide) (�leri Bash Betikleme K�lavuzu), ve bir Frans�zca �evirisini buldum.
�ngilizce versiyonunu www.tldp.org 'da bulabilirsiniz.
Bu k�lavuz k���k bir program yazmama izin verdi. ��te betik:


#!/bin/bash

REPERTOIRE=$(pwd)
cd $REPERTOIRE
mkdir ../ima
mv *.png ../ima/
for i in `ls *`
do
 gocr -f UTF8 -i $i -o $i.txt
done
cd ..
mv ima/ $REPERTOIRE
cd $REPERTOIRE
cat *.txt | sed -e 's/_//g'  -e 's/(PICTURE)//g' -e 's/�/i/g' \
-e 's/�/i/g' -e 's/F/r/g' -e 's/�/i/g' > test.txt

Dosya �al��t�r�labilir olarak de�i�tirildi ve /usr/local/bin 'e root olarak ocr-rp ismiyle kopyaland�.

�al��mas� i�in, i�lenecek dizinde olmam�z gerekir.Bunu �al��t�r�n:
ocr-rp
pwd beti�e dizin yolunu verecek, sonra dizinin d���na ima yarat�l�r ve t�m .png dosyalar� i�ine ta��n�r. T�m .txt dosyalar� sonra listelenir, gocr ile i�lemden ge�irilir, test.txt 'de birle�tirilir ve Frans�zca karakterleri uydurmak i�in baz� de�i�iklikler yap�l�r.

Ve ayn� i�leme �nceden oldu�u gibi devam ederiz: Mozilla Composer 'a kopyala/yap��t�r .
En tembelce ��z�m, beti�in baz� sayfa ba�l�klar�n� ve altl�klar�n� metin dosyas�na eklemesini, bunu saklamas�n� ve Mozilla Composer '� do�rudan a�mas�n� sa�lamak olurdu fakat fazla tembelim. Bunu yar�n yapaca��m!!!! ;-)

Sonu�

Bu, dijitalle�tirme ara�lar� hakk�nda sadece bir g�zden ge�irmeydi ve a��k�as�, bunu yapmak i�in birden fazla ve daha iyi yollar vard�r. Fakat GNU/Linux d�nyas�nda bir ger�ek vard�r: donan�m ara�lar� her y�l daha iyi desteklenir ve kullan�m� kolayla�t�r�l�r.
�rne�in, benim 50 MB g�r�nt�leri tutmak i�in bir DVD yaz�c� kulland�m. Kurulumu 10 dakikam� ald� ve k3b ile s�k�nt� olmadan �al��t� (Sadece yapt���m: apt-get install dvdrtools dvd+rwtools).
Fakat eski bir PII 350, 192MB RAM, ucuz bir taray�c�, DVD yaz�c�, biraz sabitdisk alan� ile, elektronikle ilgili eski bir k�t dergiye "�l�ms�zl�k" vermek i�in yeterince iyi bir dijitalle�tirme arac�na sahipsiniz. Dijitalle�tirme yapmak i�in kulland���m ara�lar�n ana sayfalar�: