NAME
App::Greple::xlate - modul de suport pentru traducere pentru greple
SYNOPSIS
greple -Mxlate -e ENGINE --xlate pattern target-file
greple -Mxlate::deepl --xlate pattern target-file
VERSION
Version 0.36
DESCRIPTION
Modulul Greple xlate găsește blocurile de text dorite și le înlocuiește cu textul tradus. În prezent, modulul DeepL (deepl.pm) și ChatGPT (gpt3.pm) sunt implementate ca motoare de bază. Suportul experimental pentru gpt-4 și gpt-4o este, de asemenea, inclus.
Dacă doriți să traduceți blocurile de text normale dintr-un document scris în stilul pod al Perl, utilizați comanda greple cu modulul xlate::deepl
și perl
în felul următor:
greple -Mxlate::deepl -Mperl --pod --re '^(\w.*\n)+' --all foo.pm
În această comandă, șirul de tipar ^(\w.*\n)+
înseamnă linii consecutive care încep cu litere alfanumerice. Această comandă arată zona care urmează să fie tradusă evidențiată. Opțiunea --all este utilizată pentru a produce întregul text.
Apoi adăugați opțiunea --xlate
pentru a traduce zona selectată. Apoi, va găsi secțiunile dorite și le va înlocui cu rezultatul comenzii deepl.
În mod implicit, textul original și textul tradus sunt afișate în formatul "conflict marker", compatibil cu git(1). Utilizând formatul ifdef
, puteți obține partea dorită cu ușurință folosind comanda unifdef(1). Formatul de ieșire poate fi specificat prin opțiunea --xlate-format.
Dacă doriți să traduceți întregul text, utilizați opțiunea --match-all. Aceasta este o scurtătură pentru a specifica modelul (?s).+
care se potrivește cu întregul text.
Formatul datelor pentru markerul de conflict poate fi vizualizat în stil side-by-side folosind comanda sdif
cu opțiunea -V
. Deoarece nu are sens să comparăm pe baza fiecărui șir de caractere, se recomandă opțiunea --no-cdif
. Dacă nu aveți nevoie să colorați textul, specificați --no-textcolor
(sau --no-tc
).
sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm
NORMALIZATION
Procesarea se face în unități specificate, dar în cazul unei secvențe de mai multe linii de text ne-gol, acestea sunt convertite împreună într-o singură linie. Această operație se efectuează astfel:
Se elimină spațiile albe de la început și sfârșitul fiecărei linii.
Dacă o linie se încheie cu un caracter de punctuație de lățime completă, concatenează cu linia următoare.
Dacă o linie se termină cu un caracter de lățime completă și linia următoare începe cu un caracter de lățime completă, se concatenează liniile.
Dacă fie sfârșitul sau începutul unei linii nu este un caracter de lățime completă, acestea sunt concatenate prin inserarea unui caracter spațiu.
Datele cache sunt gestionate pe baza textului normalizat, astfel încât chiar dacă se fac modificări care nu afectează rezultatele normalizării, datele de traducere cache vor fi în continuare eficiente.
Acest proces de normalizare este efectuat doar pentru primul (0-lea) și pentru modelul cu număr par. Prin urmare, dacă sunt specificate două modele după cum urmează, textul care se potrivește cu primul model va fi procesat după normalizare, iar niciun proces de normalizare nu va fi efectuat pe textul care se potrivește cu al doilea model.
greple -Mxlate -E normalized -E not-normalized
Prin urmare, folosiți primul model pentru textul care trebuie procesat prin combinarea mai multor linii într-o singură linie, și folosiți al doilea model pentru textul pre-formatat. Dacă nu există text de potrivit în primul model, atunci folosiți un model care nu se potrivește cu nimic, cum ar fi (?!)
.
MASKING
Uneori, există părți ale textului pe care nu dorești să le traduci. De exemplu, tag-urile din fișierele markdown. DeepL sugerează că în astfel de cazuri, partea de text de exclus să fie convertită în tag-uri XML, tradusă, și apoi restaurată după ce traducerea este completă. Pentru a susține acest lucru, este posibil să specifici părțile care trebuie mascate de la traducere.
--xlate-setopt maskfile=MASKPATTERN
Acesta va interpreta fiecare linie a fișierului `MASKPATTERN` ca o expresie regulată, va traduce șirurile care se potrivesc cu ea, și va reveni la forma inițială după procesare. Liniile care încep cu #
sunt ignorate.
Această interfață este experimentală și este supusă unor posibile schimbări în viitor.
OPTIONS
- --xlate
- --xlate-color
- --xlate-fold
- --xlate-fold-width=n (Default: 70)
-
Invocați procesul de traducere pentru fiecare zonă potrivită.
Fără această opțiune, greple se comportă ca o comandă de căutare normală. Deci puteți verifica care parte a fișierului va fi supusă traducerii înainte de a invoca lucrul efectiv.
Rezultatul comenzii este trimis la ieșirea standard, deci redirecționați-l într-un fișier dacă este necesar sau luați în considerare utilizarea modulului App::Greple::update.
Opțiunea --xlate apelează opțiunea --xlate-color cu opțiunea --color=never.
Cu opțiunea --xlate-fold, textul convertit este pliat în funcție de lățimea specificată. Lățimea implicită este de 70 și poate fi setată prin opțiunea --xlate-fold-width. Patru coloane sunt rezervate pentru operația run-in, astfel încât fiecare linie poate conține cel mult 74 de caractere.
- --xlate-engine=engine
-
Specifică motorul de traducere care trebuie utilizat. Dacă specifici direct modulul motorului, cum ar fi
-Mxlate::deepl
, nu este nevoie să folosești această opțiune.În acest moment, următoarele motoare sunt disponibile
deepl: DeepL API
gpt3: gpt-3.5-turbo
gpt4: gpt-4-turbo
gpt4o: gpt-4o-mini
Interfața lui gpt-4o este instabilă și nu poate fi garantată că funcționează corect în acest moment.
- --xlate-labor
- --xlabor
-
În loc să apelați motorul de traducere, se așteaptă să lucrați pentru el. După ce ați pregătit textul pentru a fi tradus, acesta este copiat în clipboard. Se așteaptă să îl lipiți în formular, să copiați rezultatul în clipboard și să apăsați Enter.
- --xlate-to (Default:
EN-US
) -
Specificați limba țintă. Puteți obține limbile disponibile prin comanda
deepl languages
atunci când utilizați motorul DeepL. - --xlate-format=format (Default:
conflict
) -
Specificați formatul de ieșire pentru textul original și cel tradus.
Formatele următoare, în afara
xtxt
, presupun că partea de tradus este o colecție de linii. De fapt, este posibil să traduci doar o porțiune dintr-o linie, iar specificarea unui format diferit dextxt
nu va produce rezultate semnificative.- conflict, cm
-
Textul original și cel convertit sunt tipărite în formatul de marcare a conflictelor git(1).
<<<<<<< ORIGINAL original text ======= translated Japanese text >>>>>>> JA
Puteți recupera fișierul original cu următoarea comandă sed(1).
sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
- ifdef
-
Textul original și cel convertit sunt tipărite în formatul cpp(1)
#ifdef
.#ifdef ORIGINAL original text #endif #ifdef JA translated Japanese text #endif
Puteți recupera doar textul japonez cu comanda unifdef:
unifdef -UORIGINAL -DJA foo.ja.pm
- space
- space+
-
Original text:
- xtxt
-
Dacă formatul este
xtxt
(text tradus) sau necunoscut, se tipărește doar textul tradus.
- --xlate-maxlen=chars (Default: 0)
-
Traduceți următorul text în limba română, linie cu linie.
- --xlate-maxline=n (Default: 0)
-
Specifică numărul maxim de linii de text care vor fi trimise la API odată.
Setează această valoare la 1 dacă vrei să traduci câte o linie pe rând. Această opțiune primește prioritate față de opțiunea
--xlate-maxlen
. - --[no-]xlate-progress (Default: True)
-
Vedeți rezultatul traducerii în timp real în ieșirea STDERR.
- --match-all
-
Setați întregul text al fișierului ca zonă țintă.
CACHE OPTIONS
Modulul xlate poate stoca textul tradus în cache pentru fiecare fișier și îl poate citi înainte de execuție pentru a elimina costurile de întrebare către server. Cu strategia implicită de cache auto
, acesta menține datele cache doar atunci când fișierul cache există pentru fișierul țintă.
- --cache-clear
-
Opțiunea --cache-clear poate fi utilizată pentru a iniția gestionarea cache-ului sau pentru a reîmprospăta toate datele cache existente. Odată executată cu această opțiune, va fi creat un nou fișier cache dacă nu există și apoi va fi menținut automat.
- --xlate-cache=strategy
-
auto
(Default)-
Mențineți fișierul cache dacă există.
create
-
Creați un fișier cache gol și ieșiți.
always
,yes
,1
-
Mențineți cache-ul oricum, atâta timp cât ținta este un fișier normal.
clear
-
Ștergeți mai întâi datele cache.
never
,no
,0
-
Nu utilizați niciodată fișierul cache chiar dacă există.
accumulate
-
În mod implicit, datele neutilizate sunt eliminate din fișierul cache. Dacă nu doriți să le eliminați și să le păstrați în fișier, utilizați
accumulate
.
COMMAND LINE INTERFACE
Puteți utiliza cu ușurință acest modul de la linia de comandă folosind comanda xlate
inclusă în distribuție. Consultați informațiile de ajutor xlate
pentru utilizare.
Comanda xlate
funcționează în concordanță cu mediul Docker, deci chiar dacă nu aveți nimic instalat la îndemână, puteți să-l utilizați atâta timp cât Docker este disponibil. Utilizați opțiunea -D
sau -C
.
De asemenea, deoarece sunt furnizate fișiere make pentru diferite stiluri de documente, traducerea în alte limbi este posibilă fără specificații speciale. Utilizați opțiunea -M
.
Puteți combina și opțiunile Docker și make astfel încât să puteți rula make într-un mediu Docker.
Rularea ca xlate -GC
va lansa un shell cu depozitul git de lucru curent montat.
Citiți articolul în limba japoneză din secțiunea "VEZI ȘI" pentru detalii.
xlate [ options ] -t lang file [ greple options ]
-h help
-v show version
-d debug
-n dry-run
-a use API
-c just check translation area
-r refresh cache
-s silent mode
-e # translation engine (default "deepl")
-p # pattern to determine translation area
-w # wrap line by # width
-o # output format (default "xtxt", or "cm", "ifdef")
-f # from lang (ignored)
-t # to lang (required, no default)
-m # max length per API call
-l # show library files (XLATE.mk, xlate.el)
-- terminate option parsing
Make options
-M run make
-n dry-run
Docker options
-G mount git top-level directory
-B run in non-interactive (batch) mode
-R mount read-only
-E * specify environment variable to be inherited
-I * specify altanative docker image (default: tecolicom/xlate:version)
-D * run xlate on the container with the rest parameters
-C * run following command on the container, or run shell
Control Files:
*.LANG translation languates
*.FORMAT translation foramt (xtxt, cm, ifdef)
*.ENGINE translation engine (deepl or gpt3)
EMACS
Încărcați fișierul xlate.el inclus în depozit pentru a utiliza comanda xlate
din editorul Emacs. Funcția xlate-region
traduce regiunea dată. Limba implicită este EN-US
și puteți specifica limba prin invocarea acesteia cu un argument de prefix.
ENVIRONMENT
- DEEPL_AUTH_KEY
-
Setați cheia de autentificare pentru serviciul DeepL.
- OPENAI_API_KEY
-
Cheia de autentificare OpenAI.
INSTALL
CPANMINUS
$ cpanm App::Greple::xlate
TOOLS
Trebuie să instalezi instrumentele de linie de comandă pentru DeepL și ChatGPT.
https://github.com/DeepLcom/deepl-python
https://github.com/tecolicom/App-gpty
SEE ALSO
https://hub.docker.com/r/tecolicom/xlate
- https://github.com/DeepLcom/deepl-python
-
Bibliotecă Python DeepL și comandă CLI.
- https://github.com/openai/openai-python
-
Biblioteca Python OpenAI
- https://github.com/tecolicom/App-gpty
-
Interfața de linie de comandă OpenAI
- App::Greple
-
Consultați manualul greple pentru detalii despre modelul de text țintă. Utilizați opțiunile --inside, --outside, --include, --exclude pentru a limita zona de potrivire.
- App::Greple::update
-
Puteți utiliza modulul
-Mupdate
pentru a modifica fișierele în funcție de rezultatul comenzii greple. - App::sdif
-
Utilizați sdif pentru a afișa formatul markerului de conflict alături de opțiunea -V.
ARTICLES
https://qiita.com/kaz-utashiro/items/1c1a51a4591922e18250
Modulul Greple pentru a traduce și înlocui doar părțile necesare cu ajutorul API-ului DeepL (în japoneză)
https://qiita.com/kaz-utashiro/items/a5e19736416ca183ecf6
Generarea documentelor în 15 limbi cu modulul DeepL API (în japoneză)
https://qiita.com/kaz-utashiro/items/1b9e155d6ae0620ab4dd
Mediu Docker de traducere automată cu ajutorul API-ului DeepL (în japoneză)
AUTHOR
Kazumasa Utashiro
LICENSE
Copyright © 2023-2024 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.