SEARCH
NEW RPMS
DIRECTORIES
ABOUT
FAQ
VARIOUS
BLOG
DONATE


YUM REPOSITORY

 
 

MAN page from Fedora 13 hunspell-1.2.8-17.fc13.x86_64.rpm

hunspell

Section: User Commands (1)
Updated: 2008. április 11.
Index 

NÉV

hunspell - unicode-os helyesírás-ellenőrző, szótövező és morfológiai elemző program 

ÁTTEKINTÉS

hunspell [-1aDGHhLlmnstvw] [--check-url] [-d szótár[,...]] [-p sajátszótár] [állomány(ok)] 

LEÍRÁS

Ahunspellfelismeri és javítja az elütéseket és típushibákategyszerű szöveges, (La)TeX, HTML és groff (kézikönyv oldal) állományokban.

Ha nem adunk meg állománynév-paramétert, a Hunspell az Ispellcsőfelületéhez hasonlóan működik: a bemenet sorait szavakra bontja,és *, +, vagy - jellel kezdődő kimeneti sorral jelzi, ha egy szó jó,és # vagy & jellel, ha rossz. A csőfelület parancsait viszont azIspellhez hasonlóan csak a-akapcsoló megadásával értelmezi.

Állománynév paraméter esetén elindul egy az Ispelléhez hasonló interaktív felület. 

KAPCSOLÓK

-1
Speciális formátum: a bemeneti állomány tabulátorjelet tartalmazó soraiból csak azelső tabulátorjel előtti karaktersorozatot vizsgálja meg.
-a
Ispellhez csőfelület. A!,+,-,@,#,vagy^jellel kezdődő sorok a csőfelület parancsai, jelentésüketaz Ispell kézikönyvoldal részletezi. A -a kapcsolóhatására a kimenetben a jó szavakat csak csillaggal jelzia Hunspell. Ez nagyobb kompatibilitást biztosít az Ispellt használó programoknémelyikével (például a LyX-szel). Ekkor nem kellmegadnunk a -a kapcsolót, mivel az Ispellthasználó programok automatikusan ezzel a kapcsolóval indítjákel az Ispell nevében futó Hunspellt is.
-d szótár[,szótár2,...]
Beállítja a helyesírási szótárakat akiterjesztés nélküli szótárnevek, útvonalakmegadásával.

Például a

hunspell -d hu_HU,hu_geo,hu_med,de_DE,de_med

a magyar alapszótárat és kiegészítő szótárait,valamint német alapszótárat és annak egy kiegészítőszótárát tölti be. Az alapszótárak egy aff és egy dickiterjesztésű állományból állnak, a kiegészítő szótárakcsak dic állományból. A kiegészítő szótáraknevére vonatkozóan nincs szabály (csak a dic kiterjesztés),a szótárnevek sorrendje határozza meg, hogy melyik alapszótárhoztöltődnek be a kiegészítő szótárak (ami pedig meghatározzaa javaslattevést). Az első szótár mindig alapszótár.

Az alapértelmezett szótár a környezet nyelvi beállításától függaz Unix rendszereken. Locale hiányában a/usr/share/hunspell/defaultaz alapértelmezett szótár.

A megadott útvonal lehet abszolút és relatív is. Relatívútvonal esetén először az aktuális, majd a/usr/share/hunspellés még több más könyvtárban keresi a szótárt a program. L. -D és aPÉLDÁK.

-D
A keresési útvonalak, az elérhető és betöltött szótárak útvonalánakkijelzése.
-G
A -l, -w, és -L kapcsolókat kiegészítő kapcsoló. A standard bemenetrőlérkező hibás szavak, illetvesorok megjelenítése helyett a jó szavak és a hibátlan sorok megjelenítésétkérhetjük vele. Ha mást nem adunk meg, a -l kapcsoló hatásának megfelelőenműködik, csak a rossz helyett a jó szavakat írja a standard kimenetre.
-h, --help
A beépített leírás megjelenítése.
-H
HTML bemeneti állományformátum beállítása. Ha az állománynevének .html, .htm, vagy .xml a kiterjesztése, ez automatikusan bekövetkezik.
-l
Kiírja a hibás szavakat a standard bemenetről érkező állományból.Használható a -H, -t, -n, -1 kapcsolókkal együtt is. A -G kapcsolómegfordítja a Hunspell működését: csak a jó szavak kerülnek kiírásra.
-L
Csak a hibás szavakat tartalmazó sorokat írja ki a standard bemenetről érkező állományból.Használható a -H, -t, -n, -1 kapcsolókkal együtt is. A -G kapcsolómegfordítja a működését: csak azok a sorok kerülnek kiírásra, amelyek egyhibás szót sem tartalmaznak.
-m
Elemző üzemmód: a bemeneti szövegszavak morfológia elemzése, illetve a szótárimorfológiai leírás hiányában a toldalékolt szavak kapcsolóinakkijelzése (szótárfejlesztőknek).
-n
Nroff/troff bemeneti állományformátum beállítása, elsősorban a kézikönyvlapok ellenőrzésére.
-p saját_szótár
A felhasználó saját szótárának beállítására szolgál.

Az alapértelmezett saját szótár a$HOME/.hunspell_defaultállomány. Ha szótárat is megadunk a-dkapcsolóval, vagy aDICTIONARYkörnyezeti változóval, a saját szótár a$HOME/.hunspell_szótárnévlesz. Ha a saját szótár nem létezik, létrehozza.

Ha az aktuális könyvtárban is van egy ugyanilyen nevűállomány, akkor annak tartalma is beolvasásra kerül,mint saját szótár, és az újonnan felvett szavak iside kerülnek.

A-p ,vagy aWORDLISTkörnyezeti változó megadásával új saját szótáratjelölünk ki. A saját szótárat az aktuális könyvtárban,és a saját könyvtár gyökerében ($HOME) keresi aHunspell. Ha nem található, akkor az újonnan felvettszavak mentésénél létrehozza a saját könyvtár gyökerében.

-s
Tövező üzemmód: a bemenő szövegszavak tövezése (a szótártól függőpontossággal).
-t
LaTeX bemeneti állományformátum beállítása. Ha az állomány nevének .texa kiterjesztése, ez automatikusan bekövetkezik.
-u
Tipikus hibák kijelzése az állományból, cserejavaslattal.
-u2
Tipikus hibák és javításuk kijelzése módosítható, és ased programmal végrehajtatható formában.Irányítsuk a Hunspell kimenetét egy állományba.Törüljük azokat a sorokat az elmentett állományból,amelyek sed paranccsal megadott javítását nem szeretnénk.Mentsük el az állományt, ésa sed -f javítás eredeti_állomány >javított_állományparanccsal javíthatjuk az állományt gyorsanés egyszerűen. (A sok hibát tartalmazó állományokjavítását gyorsítja meg ez a lehetőség.)
-U
Ha az -u kapcsolóval kapott javaslatokat mind el szeretnénk fogadni,akkor az -U kapcsolóval a Hunspell automatikusanvégrehajtja a cseréket, és a módosított állományta szabványos kimenetre küldi. Példa a javításra:hunspell -U eredeti_állomány >javított_állomány.A hibakimeneten megjelennek a javítások is még egyszer, a- kapcsolóhoz hasonló módon.
-v
Verziószám.
-vv
Verziószám (Ispell kompatibilitás miatt).
-w
Csak a hibás szavakat írja ki a standard bemenetről érkező, soronkéntegy szót tartalmazó állományból. A sorok nincsenek szavakrabontva. A sorok szavakra bontása, és csak a hibás szavak kiírása a -w kapcsolóvalérhető el. A -G kapcsoló megfordítja a Hunspell működését: csak a jó szavak kerülnekkiírásra.
 

INTERAKTÍV FELÜLET

A felület legfelső sorában a hibás szóalakot, és az éppen vizsgáltállomány nevét látjuk. Amennyiben egy szóalak szótári tiltásmiatt nem kerül elfogadásra, a bal felső sarokban a TILTOTT!(FORBIDDEN!) üzenet is megjelenik. Ez az üzenet arra utal, hogy nemhiányos szókincs, hanem szándékos tiltás miatt nem került a szóelfogadásra. Az első sor alatt az állomány hibás szót tartalmazó sorát, ésszövegkörnyezetét láthatjuk, majd ezt követik a javaslatok, ha vannak.

A használható billentyűkombinációk:

Szóköz
Továbblépés javítás nélkül a következő hibás szóra.
Számok
A megfelelő javaslat kiválasztása.
c
Csere. A hibás szó cseréje a megadott szóra, vagy szavakra.Az Escape billentyű kétszeri lenyomásával megszakíthatjuk aa cserét.
j
A szó elfogadása a program futásának befejeződéséig.
f
A szó felvétele a saját szótárba.
k
A szó kisbetűsként való felvétele a saját szótárba.
t
Ragozott tőszó felvétele. A ragozás a másodikkéntmegadott, mintául szolgáló szó alapján történik.Ha ez a szó nincs felvéve a szótárba, a tőszófelvételtelölről kell kezdeni.

Példa: gyakran hiányoznak az idegen és amozaikszavak. Vegyük fel a hiányzó OTP szóta tv köznévi mozaikszó toldalékaival!Lenyomjuk a t billentyűt, beírjuk, hogy OTP,leütjük az új sor billentyűt, beírjuk, hogy tv, és ismét új sor. A tv szóugyanis már szerepel a szótárban, és ragozásamondja meg a programnak, hogy az OTP szótmilyen toldalékokkal szeretnénk látni, pl.OTP-hez, OTP-met stb. a tv-hez, tv-met mintájára.A -val/-vel, -vá/-vé toldalékokata kötőjellel kapcsolt toldalékú szavakesetében külön kell felvenni, de még így is sokkalkényelmesebb a speciális tőfelvétel, mint minden(akár több száz) toldalékos alakot külön-különfelvenni.

Egy kis segítség a minta kiválasztásához:első menetben a hangrend számít. Pl. mozaikszavaknál amély hangrendű új szavak felvételénél használhatjuka MÁV szót példaként, ajakréses magas hangrendnélpedig az említett tv-t. Ajakkerekítéses magas hangrendesetében a HÖK szót használhatjuk (amíg át nemlesz javítva a helyes hök-re). Ha a hiányzószó nem mozaikszó, hanem például tulajdonnév, a Pál, Péter, Örs szavakat adhatjukmeg példának a hangrendtől függően. Ha megegyszerű köznévről van szó, akkor használjuk azok, ék, ük szavakat.Igéknél áll, vél, ül,ikes igéknél ázik, vérzik, nőziklehet a példa (remélhetőleg a következőváltozatokban egyszerűsödik ez a tőfelvétel).

Az Escape billentyű kétszeri lenyomásával megszakíthatjuk ezta műveletet.

Az itt felvett szavak automatikusan a sajátszótárba kerülnek. Ha ezt innen törölniszeretnénk, a programból kilépvea saját szótár kézi átszerkesztésével tehetjük meg.

m
Kilépés a változtatások mentése nélkül. A programváltoztatás megléte esetén megerősítést kér.
v
Az állomány ellenőrzésének megszakítása a változtatásokmentésével. Ha van következő állomány, akkora program annak ellenőrzését kezdi el.
?
Segítség. Hasonló rövid leírás megjelenítése abillentyűparancsokról.
 

CSŐFELÜLET

A Hunspell soronként dolgozza fel azállományokat, a helyes szavakat * (tőszó), -(összetett szó), vagy+(ragozott szó) karakterrel jelöli, a helyteleneket#(nincs javaslat) , vagy&(van javaslat) karakterrel. A + jelet a kimenetben követi még a szótő.A # jel után a hibás szó, és kezdőpozíciója van feltüntetve.A & jelet követi a hibás szó; a javaslatok száma; a hibás szókezdőpozíciója; majd kettőspont után a javaslatok, vesszővel elválasztva:

macska*macskabajusz-macskák+ macskamcsk# mcsk 0macka& macka 7 0: macska, maca, racka, packa, vacka, marka, mackó
 

PÉLDÁK

hunspell -d en_US english.html
Az amerikai angol helyesírási szótár kiválasztása (aktuális, vagy a/usr/share/hunspellkönyvtárból.
hunspell -d /opt/OpenOffice.org1.0.1/share/dict/ooo/de_DE
A német helyesírási szótár kiválasztása a megadott abszolútútvonalról, a standard bemenet feldolgozásával.
hunspell *.html
Az aktuális könyvtárban található összes HTML állományinteraktív ellenőrzése.
hunspell -l szöveg.html
A megadott állomány hibás szavainak kiírása.
 

KÖRNYEZET

DICTIONARY
A szótár helyének megadására szolgál. Szerepe megegyezik a-dkapcsolóval.
DICPATH
A szótárkeresési útvonalat tartalmazó változó.
WORDLIST
A saját szótár helyének megadására szolgál. Szerepe megegyezik a-pkapcsolóval.
 

ÁLLOMÁNYOK

/usr/share/default.affAz alapértelmezett ragozási táblázat. Lásd hunspell(4).

/usr/share/default.dicAz alapértelmezett szótár az előző ragozási táblázathoz.Lásd hunspell(4).$HOME/.hunspell_defaultAz alapértelmezett saját szótár. Az állományt létrehozzaa Hunspell, ha nem létezik. Lásd ispell(1). 

LÁSD MÉG

hunspell (4),hunstem (1),makedb (1),lookdb (1),ispell (1),ispell (4),Magyar Ispell dokumentáció. 

ELŐNYÖK

A program a következő előnyöket nyújtja a hasonló célokat szolgáló Ispell-lel szemben:
-
Képzők átfogó ismerete. (Több tízezer helyes szóalak elfogadását tettelehetővé a tesztelésre használt 4 millió szavas gyakorisági szótárban.)
-
Homonimák kezelése (nincsenek például olyan alakok elfogadva, mint megvárban).
-
Helyes javaslatok a több karakter változásával járó tipikus hibákra(j/ly, íj/ijj, nyj/nny és még több tucatnyi tévesztés megvizsgálásával).Az Ispell csak két karakter felcserélése; vagy egy karakter hiánya,cseréje, illetve felesleges jelenléte esetén ad helyes javaslatot.
-
Az összes helyes összetett szónak látszó, de tipikus hibával előálló alak tiltása (karvaj, színtű, súlytó stb.)
-
Javaslatok valószínűségi sorrendben jelennek meg (tipikus hibák, i/í, o/ó, u/ú tévesztések stb.).
-
Összetett szavak esetén 6–3-as szabály alkalmazása (helyesírás-ellenőrző, gépkocsi-összeszerelés).
-
Mozgószabály alkalmazása (kiviteli engedély, kiviteliengedély-kérés).
-
A magyar nyelv egyéb összetételi szabályainak alkalmazása (például hatlövetű, tizenkét lövetű, kéthavi, két hónapos, másodmagával).
-
Leg-, legesleg- és -bb confixum helyes kezelése (nincs pl. legédes, csak legédesebb).
-
Ragozható tőszófelvétel. Megkönnyíti egy új szó ragozott változatainak ellenőrzését, feleslegessé téve ezek külön-külön történő felvételét a saját szótárba.
-
Javaslatok mássalhangzó-triplázások (sakkkör, baletttáncos, dzsesszszak) esetén.(Ispell helyesnek fogadja el ezeket.)
-
Javaslatok szótagduplázások (oktatatás, igenenevet) esetén.
-
Javaslatok ékezet nélküli szövegre (tukorfurogep->tükörfúrógép).
-
Kötőjeles szavak kezelése (unos-untalan).
-
Toldalékolt számok (1-jén, 11-én, 5.-et) kezelése.
-
°, %, és § jelek (%-kal) toldalékolt alakjainak kezelése.
-
Mozaikszavak (MÁV-osokat) kezelése.
-
Y-ra végződő szavak (boyjal, pennyvel) kezelése.
-
Idegen ejtésű szótagra végződő szavak (Anonymusszal, Voltaire-nek) kezelése.
-
Két szóból álló földrajzi nevek (San Franciscó-i) kezelése.
-
Hibás alakok tiltása (Babitssal, tanit, alkotóművész stb.)
-
Tiltások jelzése a felhasználói felületen.
-
Egyéb (például az Ispell ragozott utószó esetében bármilyen szóösszetételt elfogad: macskatekerem, kutyakavarom, ezt a Hunspell nem teszi meg).
-
Magyar nyelvű (illetve locale (7)függő) felület.
-
Hordozható szöveges szótárállományok, szemben az Ispell platform, és bináris Ispell fordítástól függően (nem) kezelhető adatállományaival.

 

SZERZŐ

A Hunspell az OpenOffice.org MySpell függvénykönyvtárán továbbfejlesztése.A MySpell affixumtömörítésének mintája az International Ispell program volt.

A mintaként szolgáló International Ispell szerzője Geoff Kuenning,sok más elődje munkájára támaszkodva (l. ispell(1)).

A Myspellt Kevin Hendricks készítette a legjelentősebbnyílt forráskódú irodai csomaghoz, az OpenOffice.org-hoz 2001-2002-ben(l. http://hu.openoffice.org).

A Hunspell programkönyvtárat és parancssori programotNémeth László <nemethAATTopenoffice PONT org> készítette 2002-2008-ban.


 

Index

NÉV
ÁTTEKINTÉS
LEÍRÁS
KAPCSOLÓK
INTERAKTÍV FELÜLET
CSŐFELÜLET
PÉLDÁK
KÖRNYEZET
ÁLLOMÁNYOK
LÁSD MÉG
ELŐNYÖK
SZERZŐ

This document was created byman2html,using the manual pages.