LanguageTool jako inteligentny moduł sprawdzania pisowni

Jedną ze zdumiewających możliwości aplikacji LanguageTool Plugin jest zaawansowane sprawdzanie pisowni. Sprawdzanie pisowni odbywa się w trybie wsadowym, jest więc szybsze niż standardowe sprawdzenie w Studio. Grupowe ignorowanie błędów jest łatwiejsze i bezpieczniejsze. Niepotrzebnie zignorowane błędy można szybko przywrócić, czego nie zrobimy w przypadku standardowego sprawdzenia pisowni w Studio.

A co najważniejsze możemy wykrywać błędy m.in. w:

  • nazwach własnych,
  • nazwach produktów,
  • słowach, które mają pozostać nieprzetłumaczone,
  • źródłowych opcjach UI w przypadku ich tłumaczenia dwujęzycznego,
  • akronimach,
  • wyrazach pisanych wielkimi literami,
  • wyrazach pisanych mieszanymi literami,
  • wyrazach zawierających cyfry,
  • oraz wyrażeniach alfanumerycznych.

LanguageTool Plugin to inteligentny spellchecker ze sprawdzaniem akronimów i wyrażeń alfanumerycznych. Oto jak to działa w praktyce.

Smart Spellcheck
Smart Spellcheck
Error Error detected by QA-checker
Source Target LT Plugin Number Verifier Simple Numcheck
ATmega168 ATmeg168 Yes No Yes
ATmega328 ATmega228 Yes Yes Yes
Arduino Ardoino Yes No No
Due Deu Yes No No
SAM3X8e SAM38Xe Yes Yes Yes
LilyPad LillyPad Yes No No

Każdy błąd wykrywany przez LanguageTool Plugin jest wyraźnie wskazywany w kolumnie Message. Każdy błąd wykrywany przez LanguageTool Plugin jest wyraźnie podświetlony w kolumnie Target.
Masz pewność, że nie zignorujesz mylnie błędu zwracanego przez standardowy moduł sprawdzania pisowni w Studio.

Jak skonfigurować LanguageTool Plugin, aby wykrywał wszystkie tego typu błędy.

Spellchecker Settings
Spellchecker Settings

Uwagi małym druczkiem: nie wszystkie wymienione wyżej błędy są wykrywane przez LanguageTool Plugin domyślnie. Zależy to od domyślnej konfiguracji modułu sprawdzania pisowni pakietu LanguageTool. Za konfigurację modułu sprawdzania pisowni pakietu LanguageTool odpowiada plik INFO znajdujący w folderze:

c:\LanguageTool-4.3\org\languagetool\resource\en\hunspell\en-US.info (for en-US)

c:\LanguageTool-4.3\org\languagetool\resource\pl\hunspell\pl_PL.info (for pl-PL)

Pierwszy wyróżniony człon to ścieżka do pakietu LanguageTool, a następne wyróżnione człony to dany język.

Zawartość pliku INFO

Dla języka pl-PL:

# Dictionary properties.
fsa.dict.separator=+
fsa.dict.encoding=UTF-8
fsa.dict.encoder=none
fsa.dict.frequency-included=true
fsa.dict.speller.locale=pl_PL
fsa.dict.speller.ignore-diacritics=true
fsa.dict.speller.ignore-all-uppercase=false
fsa.dict.speller.ignore-camel-case=false
fsa.dict.speller.ignore-numbers=false
fsa.dict.speller.ignore-punctuation=true
fsa.dict.speller.equivalent-chars=x ź, l ł, u ó, ó u, u y, i j, u ł, d t, v w, - —, - –, 0 O
fsa.dict.speller.replacement-pairs=ć dź, ć dz, c dz, ch h, dź ć, dz ć, ę em, ę en, em ę, en ę, h ch, osc ość, loz łos, ą oł, oł ą, ą om, om ą, ą on, on ą, ż rz, rz ż, rz sz, scia ścią, sić ść, sz ż, sz rz, tro rot, x ks, z rz, nei nie, trzcionk czcionk

Dla języka en-US:

# Dictionary properties.
fsa.dict.separator=+
fsa.dict.encoding=iso-8859-2
fsa.dict.encoder=SUFFIX
fsa.dict.speller.locale=en_US
fsa.dict.speller.ignore-diacritics=true
fsa.dict.speller.ignore-all-uppercase=false
fsa.dict.speller.ignore-camel-case=false
fsa.dict.speller.ignore-numbers=false
fsa.dict.speller.replacement-pairs=ninties 1990s, a ei, ei a, a ey, ey a, ai ie, ie ai, are air, are ear, are eir, air are, air ere, ere air, ere ear, ere eir, ear are, ear air, ear ere, eir are, eir ere, f ph, ph f, gh f, f gh, kw qu, Bordo Bordeaux, bato bateau, bocoup beaucoup, buro bureau, bo beau, oo ew, ew oo, ew ui, ui ew, oo ui, ui oo, uff ough, oo ieu, ieu oo, ier ear, ear ier, air ear, shun tion, shun sion, shun cion, yersa years, phoby phobia
fsa.dict.frequency-included=true
fsa.dict.speller.ignore-all-uppercase=false

Aby opcje Ignore words with UPPER CASE…, Ignore words with miXED CASE… oraz Ignore words with numbers… działały, w pliku konfiguracji języka muszą występować 3 wyróżnione wyżej linie. Jeśli linii nie ma lub są ustawione na „true”, należy je odpowiednio zmienić.

Poniżej zamieściłem tabelę z ustawieniami domyślnymi modułu sprawdzania pisowni pakietu LanguageTool, która pozwoli w łatwy sposób sprawdzić, co należy zmienić.

Niestety nie działa to dla wszystkich języków. W poniższej tabeli zamieściłem domyślne ustawienia modułu sprawdzania pisowni LanguageTool, co pozwoli sprawdzić, czy zmiana ustawień jest możliwa dla danego języka. Kolumna FSA ignore params supported (Obsługa parametrów FSA ignore) wskazuje, czy zmiana tych parametrów w plku INFO będzie działać. Widać, że spośród przetestowanych przeze mnie języków, zmiana wszystkich trzech parametrów nie jest możliwa tylko dla języków: duński, niemiecki, portugalski i ukraiński. Nic nie trzeba zmieniać dla języków: kataloński, holenderski, szwedzki, francuski. W przypadku innych języków można natomiast zmienić parametry FSA w pliku INFO.

Pełną wersję dokumentu można znaleźć w instrukcji obsługi do wersji 2.0 wtyczki.

LT
Language Name
LT
Short Code
LT
Long Code
FSA ignore params supported Default ignore-all-uppercase Default ignore-camel-case Default ignore-numbers Path to INFO file
Asturian ast ast-ES Yes \LanguageTool-4.3\org\languagetool\resource\ast\hunspell\ast_ES.info
Belarusian be be-BY Yes true false true \LanguageTool-4.3\org\languagetool\resource\be\hunspell\be_BY.info
Breton br br-FR Yes true true true \LanguageTool-4.3\org\languagetool\resource\br\hunspell\br_FR.info
Catalan ca ca-ES No false false false
Catalan (Valencian) ca ca-ES-valencia No false false false
Chinese zh zh-CN Not tested
Danish da da-DK No \LanguageTool-4.3\org\languagetool\resource\da\danish.info
Dutch nl nl Yes false false false \LanguageTool-4.3\org\languagetool\resource\nl\spelling\nl_NL.info
English (Australian) en en-AU Yes false false true \LanguageTool-4.3\org\languagetool\resource\en\hunspell\en_AU.info
English (Canadian) en en-CA Yes false false true \LanguageTool-4.3\org\languagetool\resource\en\hunspell\en_CA.info
English (New Zealand) en en-NZ Yes false false true \LanguageTool-4.3\org\languagetool\resource\en\hunspell\en_NZ.info
English (South African) en en-ZA Yes false false true \LanguageTool-4.3\org\languagetool\resource\en\hunspell\en_ZA.info
English (GB) en en-GB Yes false false true \LanguageTool-4.3\org\languagetool\resource\en\hunspell\en_GB.info
English (US) en en-US Yes false false true \LanguageTool-4.3\org\languagetool\resource\en\hunspell\en_US.info
Esperanto eo eo Not tested
French fr fr Yes false false false \LanguageTool-4.3\org\languagetool\resource\fr\hunspell\fr_FR.info
Galician gl gl-ES Not tested
German (Germany) de-DE de-DE No false false true \LanguageTool-4.3\org\languagetool\resource\de\hunspell\de_DE.info
German (Austria) de-AT de-AT No false false true \LanguageTool-4.3\org\languagetool\resource\de\hunspell\de_AT.info
German (Switzerland) de-CH de-CH No false false true \LanguageTool-4.3\org\languagetool\resource\de\hunspell\de_CH.info
Greek el el-GR No true \LanguageTool-4.3\org\languagetool\resource\el\hunspell\el_GR.info
Italian it it Yes true false true \LanguageTool-4.3\org\languagetool\resource\it\hunspell\it_IT.info
Japanese ja ja-JP Not tested
Khmer km km-KH Not tested
Persian (Iran) fa fa Not tested
Polish pl pl-PL Yes false false true \LanguageTool-4.3\org\languagetool\resource\pl\hunspell\pl_PL.info
Portuguese (Portugal) pt-PT pt-PT No false false true
Portuguese (Angola preAO) pt-AO pt-AO No false false true
Portuguese (Brazil) pt-BR pt-BR No false false true
Portuguese (Moçambique preAO) pt-MZ pt-MZ No false false true
Romanian ro ro-RO Yes \LanguageTool-4.3\org\languagetool\resource\ro\hunspell\ro_RO.info
Russian* ru ru-RU Yes*
Latin character words are ignored
\LanguageTool-4.3\org\languagetool\resource\ru\hunspell\ru_RU.info
Serbian (Serbia) sr sr-RS Not tested
Serbian (Montenegro) sr sr-ME Not tested
Serbian (Bosnia and Herzegovina) sr sr-BA Not tested
Slovak sk sk-SK Yes true false true \LanguageTool-4.3\org\languagetool\resource\sk\hunspell\sk_SK.info
Slovenian sl sl-SI Yes true false true \LanguageTool-4.3\org\languagetool\resource\sl\hunspell\sl_SI.info
Spanish es es Yes false false true \LanguageTool-4.3\org\languagetool\resource\es\hunspell\es_ES.info
Swedish sv sv No false false false
Tagalog tl tl-PH Not tested
Tamil ta ta-IN Not tested
Ukrainian (Ukraine) uk uk-UA No true true true