NAME
App::Greple::xlate - μονάδα υποστήριξης μετάφρασης για το greple
SYNOPSIS
greple -Mxlate -e ENGINE --xlate pattern target-file
greple -Mxlate::deepl --xlate pattern target-file
VERSION
Version 0.4101
DESCRIPTION
Το μοντούλο xlate του Greple εντοπίζει τα επιθυμητά τμήματα κειμένου και τα αντικαθιστά με το μεταφρασμένο κείμενο. Αυτή τη στιγμή, έχουν ενσωματωθεί ως μηχανή πίσω από το σύστημα οι DeepL (deepl.pm) και ChatGPT (gpt3.pm). Πειραματική υποστήριξη για τα gpt-4 και gpt-4o περιλαμβάνεται επίσης.
Εάν θέλετε να μεταφράσετε κανονικά τμήματα κειμένου σε ένα έγγραφο που έχει γραφεί στο στυλ pod της Perl, χρησιμοποιήστε την εντολή greple με το xlate::deepl
και το πρόσθετο perl
όπως εξής:
greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm
Σε αυτή την εντολή, το πρότυπο συμβολοσειράς ^([\w\pP].*\n)+
σημαίνει διαδοχικές γραμμές που ξεκινούν με αλφαριθμητικούς και σημεία στίξης χαρακτήρες. Αυτή η εντολή εμφανίζει την περιοχή που πρέπει να μεταφραστεί με έντονη ανάδειξη. Η επιλογή --all χρησιμοποιείται για να παράγει ολόκληρο το κείμενο.
Στη συνέχεια, προσθέστε την επιλογή --xlate
για να μεταφράσετε την επιλεγμένη περιοχή. Στη συνέχεια, θα εντοπίσει τα επιθυμητά τμήματα και θα τα αντικαταστήσει με την έξοδο της εντολής deepl.
Από προεπιλογή, το αρχικό και το μεταφρασμένο κείμενο εκτυπώνονται στη μορφή "conflict marker" που είναι συμβατή με το git(1). Χρησιμοποιώντας τη μορφή ifdef
, μπορείτε να πάρετε το επιθυμητό τμήμα με την εντολή unifdef(1) εύκολα. Η μορφή εξόδου μπορεί να καθοριστεί με την επιλογή --xlate-format.
Εάν θέλετε να μεταφράσετε ολόκληρο το κείμενο, χρησιμοποιήστε την επιλογή --match-all. Αυτό είναι ένας συντομευμένος τρόπος για να καθορίσετε το πρότυπο (?s).+
που ταιριάζει με ολόκληρο το κείμενο.
Τα δεδομένα μορφής δείκτη σύγκρουσης μπορούν να προβληθούν σε στυλ δίπλα-δίπλα με την εντολή sdif
με την επιλογή -V
. Δεδομένου ότι δεν έχει νόημα η σύγκριση με βάση την κάθε συμβολοσειρά, συνιστάται η επιλογή --no-cdif
. Αν δεν χρειάζεστε να χρωματίσετε το κείμενο, καθορίστε το --no-textcolor
(ή --no-tc
).
sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm
NORMALIZATION
Η επεξεργασία γίνεται σε συγκεκριμένες μονάδες, αλλά στην περίπτωση μιας ακολουθίας πολλών γραμμών μη κενού κειμένου, μετατρέπονται μαζί σε μία μόνο γραμμή. Αυτή η λειτουργία εκτελείται ως εξής:
Αφαιρέστε τα κενά στην αρχή και στο τέλος κάθε γραμμής.
Εάν μια γραμμή τελειώνει με έναν χαρακτήρα στίξης πλήρους πλάτους, ενώστε τη με την επόμενη γραμμή.
Αν μια γραμμή τελειώνει με πλήρες χαρακτήρα πλάτους και η επόμενη γραμμή αρχίζει με πλήρες χαρακτήρα πλάτους, ενώστε τις γραμμές.
Αν είτε η αρχή είτε το τέλος μιας γραμμής δεν είναι πλήρες χαρακτήρας πλάτους, ενώστε τις εισάγοντας έναν χαρακτήρα κενού.
Τα δεδομένα προσωρινής μνήμης διαχειρίζονται με βάση το κανονικοποιημένο κείμενο, οπότε ακόμα κι αν γίνουν τροποποιήσεις που δεν επηρεάζουν τα αποτελέσματα της κανονικοποίησης, τα δεδομένα μετάφρασης στην προσωρινή μνήμη θα παραμείνουν αποτελεσματικά.
Αυτή η διαδικασία κανονικοποίησης πραγματοποιείται μόνο για το πρώτο (0ο) και το μονού αριθμού πρότυπο. Έτσι, εάν δύο πρότυπα καθοριστούν ως εξής, το κείμενο που ταιριάζει με το πρώτο πρότυπο θα επεξεργαστεί μετά την κανονικοποίηση, και δεν θα πραγματοποιηθεί κανονικοποίηση στο κείμενο που ταιριάζει με το δεύτερο πρότυπο.
greple -Mxlate -E normalized -E not-normalized
Συνεπώς, χρησιμοποιήστε το πρώτο πρότυπο για κείμενο που πρόκειται να επεξεργαστεί συνδυάζοντας πολλαπλές γραμμές σε μία μόνο γραμμή, και χρησιμοποιήστε το δεύτερο πρότυπο για προ-μορφωμένο κείμενο. Αν δεν υπάρχει κείμενο που να ταιριάζει στο πρώτο πρότυπο, χρησιμοποιήστε ένα πρότυπο που δεν ταιριάζει με τίποτα, όπως (?!)
.
MASKING
Μερικές φορές, υπάρχουν τμήματα κειμένου που δεν θέλετε να μεταφραστούν. Για παράδειγμα, ετικέτες σε αρχεία markdown. Το DeepL προτείνει ότι σε τέτοιες περιπτώσεις, το τμήμα του κειμένου που πρέπει να αποκλειστεί να μετατραπεί σε ετικέτες XML, να μεταφραστεί, και στη συνέχεια να αποκατασταθεί μετά την ολοκλήρωση της μετάφρασης. Για να υποστηρίξετε αυτό, είναι δυνατόν να καθορίσετε τα τμήματα που πρέπει να μείνουν απόκρυφα από τη μετάφραση.
--xlate-setopt maskfile=MASKPATTERN
Αυτό θα ερμηνεύσει κάθε γραμμή του αρχείου `MASKPATTERN` ως έναν τακτικό εκφρασμένο, θα μεταφράσει τις συμβολοσειρές που ταιριάζουν με αυτό, και θα επαναφέρει μετά την επεξεργασία. Οι γραμμές που αρχίζουν με #
αγνοούνται.
Ένα πολύπλοκο πρότυπο μπορεί να γραφτεί σε πολλαπλές γραμμές με αναδρομή με backslash.
Πώς η μετατροπή του κειμένου με τη χρήση μάσκας μπορεί να δει κανείς μέσω της επιλογής --xlate-mask.
Αυτή η διεπαφή είναι πειραματική και υπόκειται σε αλλαγές στο μέλλον.
OPTIONS
- --xlate
- --xlate-color
- --xlate-fold
- --xlate-fold-width=n (Default: 70)
-
Καλέστε τη διαδικασία μετάφρασης για κάθε ταιριαστή περιοχή.
Χωρίς αυτήν την επιλογή, το greple συμπεριφέρεται ως ένα κανονικό πρόγραμμα αναζήτησης. Έτσι μπορείτε να ελέγξετε ποιο μέρος του αρχείου θα υπόκειται στη μετάφραση πριν καλέσετε την πραγματική εργασία.
Το αποτέλεσμα της εντολής πηγαίνει στην τυπική έξοδο, οπότε αν χρειάζεται ανακατεύθυνση σε αρχείο, ή σκεφτείτε να χρησιμοποιήσετε το πρόσθετο App::Greple::update.
Η επιλογή --xlate καλεί την επιλογή --xlate-color με την επιλογή --color=never.
Με την επιλογή --xlate-fold, το μεταφρασμένο κείμενο διπλώνεται με το καθορισμένο πλάτος. Το προεπιλεγμένο πλάτος είναι 70 και μπορεί να οριστεί με την επιλογή --xlate-fold-width. Τέσσερεις στήλες είναι καταλεγμένες για τη λειτουργία run-in, οπότε κάθε γραμμή μπορεί να περιέχει το πολύ 74 χαρακτήρες.
- --xlate-engine=engine
-
Καθορίζει τη μηχανή μετάφρασης που θα χρησιμοποιηθεί. Εάν καθορίσετε απευθείας το μοντούλο της μηχανής, όπως
-Mxlate::deepl
, δεν χρειάζεται να χρησιμοποιήσετε αυτήν την επιλογή.Προς το παρόν, διατίθενται οι ακόλουθες μηχανές:
deepl: DeepL API
gpt3: gpt-3.5-turbo
gpt4: gpt-4-turbo
gpt4o: gpt-4o-mini
Η διεπαφή του gpt-4o είναι ασταθής και δεν μπορεί να εγγυηθεί ότι λειτουργεί σωστά αυτή τη στιγμή.
- --xlate-labor
- --xlabor
-
Αντί να καλείτε τη μηχανή μετάφρασης, αναμένεται να εργαστείτε εσείς. Αφού προετοιμάσετε το κείμενο που πρόκειται να μεταφραστεί, αντιγράφετε το στο πρόχειρο. Αναμένεται να το επικολλήσετε στη φόρμα, να αντιγράψετε το αποτέλεσμα στο πρόχειρο και να πατήσετε Enter.
- --xlate-to (Default:
EN-US
) -
Καθορίστε τη γλώσσα προορισμού. Μπορείτε να λάβετε τις διαθέσιμες γλώσσες με την εντολή
deepl languages
όταν χρησιμοποιείτε τη μηχανή DeepL. - --xlate-format=format (Default:
conflict
) -
Καθορίστε τη μορφή εξόδου για το αρχικό και μεταφρασμένο κείμενο.
Οι παρακάτω μορφές εκτός από το
xtxt
υποθέτουν ότι το τμήμα που πρέπει να μεταφραστεί είναι μια συλλογή γραμμών. Στην πραγματικότητα, είναι δυνατόν να μεταφράσετε μόνο ένα τμήμα μιας γραμμής, και η καθορισμένη μορφή εκτός από τοxtxt
δεν θα παράγει νόηματα.- conflict, cm
-
Ο αρχικός και μετατραπέντας κείμενος εκτυπώνονται σε μορφή δείκτη σύγκρουσης git(1).
<<<<<<< ORIGINAL original text ======= translated Japanese text >>>>>>> JA
Μπορείτε να ανακτήσετε το αρχικό αρχείο με την επόμενη εντολή sed(1).
sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
- colon, :::::::
-
```html
::::::: ORIGINAL original text ::::::: ::::::: JA translated Japanese text :::::::
<div class="original">
<div class="ORIGINAL"> original text </div> <div class="JA"> translated Japanese text </div>
Ο αριθμός των αίωνων είναι 7 από προεπιλογή. Εάν καθορίσετε μια ακολουθία αίωνων όπως
:::::
, χρησιμοποιείται αντί για τους 7 αίωνες. - ifdef
-
Ο αρχικός και μετατραπέντας κείμενος εκτυπώνονται σε μορφή cpp(1)
#ifdef
.#ifdef ORIGINAL original text #endif #ifdef JA translated Japanese text #endif
Μπορείτε να ανακτήσετε μόνο το ιαπωνικό κείμενο με την εντολή unifdef:
unifdef -UORIGINAL -DJA foo.ja.pm
- space
- space+
-
Original:
- xtxt
-
Εάν η μορφή είναι
xtxt
(μεταφρασμένο κείμενο) ή άγνωστη, εκτυπώνεται μόνο το μεταφρασμένο κείμενο.
- --xlate-maxlen=chars (Default: 0)
-
Μεταφράστε το παρακάτω κείμενο στα ελληνικά, γραμμή-προς-γραμμή.
- --xlate-maxline=n (Default: 0)
-
Καθορίστε το μέγιστο αριθμό γραμμών κειμένου που θα σταλεί στο API ταυτόχρονα.
Ορίστε αυτήν την τιμή σε 1 αν θέλετε να μεταφράσετε μία γραμμή κάθε φορά. Αυτή η επιλογή έχει προτεραιότητα έναντι της επιλογής
--xlate-maxlen
. - --[no-]xlate-progress (Default: True)
-
Δείτε το αποτέλεσμα της μετάφρασης σε πραγματικό χρόνο στην έξοδο STDERR.
- --xlate-stripe
-
Χρησιμοποιήστε το πρόσθετο App::Greple::stripe για να εμφανίσετε το ταιριασμένο τμήμα με τρόπο ζέβρα. Αυτό είναι χρήσιμο όταν τα ταιριασμένα τμήματα είναι συνδεδεμένα πίσω-μπροστά.
Η παλέτα χρωμάτων αλλάζει ανάλογα με το χρώμα του φόντου του τερματικού. Αν θέλετε να το καθορίσετε ρητά, μπορείτε να χρησιμοποιήσετε τις επιλογές --xlate-stripe-light ή --xlate-stripe-dark.
- --xlate-mask
-
Εκτελέστε τη λειτουργία μάσκας και εμφανίστε το μετατραπέν κείμενο χωρίς ανάκτηση.
- --match-all
-
Ορίστε ολόκληρο το κείμενο του αρχείου ως περιοχή στόχο.
CACHE OPTIONS
Το πρόσθετο xlate μπορεί να αποθηκεύει το μεταφρασμένο κείμενο για κάθε αρχείο και να το διαβάζει πριν από την εκτέλεση για να εξαλείψει τον χρόνο που απαιτείται για την επικοινωνία με τον διακομιστή. Με την προεπιλεγμένη στρατηγική προσωρινής αποθήκευσης auto
, διατηρεί τα δεδομένα προσωρινής αποθήκευσης μόνο όταν το αρχείο προσωρινής αποθήκευσης υπάρχει για το συγκεκριμένο αρχείο στόχο.
Χρησιμοποιήστε το --xlate-cache=clear για να εκκινήσετε τη διαχείριση της μνήμης cache ή για να καθαρίσετε όλα τα υπάρχοντα δεδομένα cache. Μόλις εκτελεστεί με αυτήν την επιλογή, θα δημιουργηθεί ένα νέο αρχείο cache αν δεν υπάρχει και στη συνέχεια θα διατηρείται αυτόματα.
- --xlate-cache=strategy
-
auto
(Default)-
Διατηρήστε το αρχείο προσωρινής αποθήκευσης αν υπάρχει.
create
-
Δημιουργήστε ένα κενό αρχείο προσωρινής αποθήκευσης και τερματίστε.
always
,yes
,1
-
Διατηρήστε την προσωρινή μνήμη ούτως ή άλλως, όσο το προορισμένο αρχείο είναι κανονικό αρχείο.
clear
-
Καθαρίστε πρώτα τα δεδομένα της προσωρινής μνήμης.
never
,no
,0
-
Ποτέ μην χρησιμοποιείτε το αρχείο της προσωρινής μνήμης, ακόμα κι αν υπάρχει.
accumulate
-
Από προεπιλογή, τα αχρησιμοποίητα δεδομένα αφαιρούνται από το αρχείο της προσωρινής μνήμης. Εάν δεν θέλετε να τα αφαιρέσετε και να τα κρατήσετε στο αρχείο, χρησιμοποιήστε την επιλογή
accumulate
.
- --xlate-update
-
Αυτή η επιλογή εξαναγκάζει την ενημέρωση του αρχείου cache ακόμα και αν δεν είναι απαραίτητο.
COMMAND LINE INTERFACE
Μπορείτε εύκολα να χρησιμοποιήσετε αυτήν την ενότητα από τη γραμμή εντολών χρησιμοποιώντας την εντολή xlate
που περιλαμβάνεται στη διανομή. Δείτε τις πληροφορίες βοήθειας της εντολής xlate
για τη χρήση.
Η εντολή xlate
λειτουργεί σε συνεργασία με το περιβάλλον Docker, οπότε ακόμα κι αν δεν έχετε κάτι εγκατεστημένο στο χέρι, μπορείτε να το χρησιμοποιήσετε όσον ο Docker είναι διαθέσιμος. Χρησιμοποιήστε την επιλογή -D
ή -C
.
Επίσης, εφόσον παρέχονται αρχεία makefiles για διάφορα στυλ εγγράφου, είναι δυνατή η μετάφραση σε άλλες γλώσσες χωρίς ειδική προδιαγραφή. Χρησιμοποιήστε την επιλογή -M
.
Μπορείτε επίσης να συνδυάσετε τις επιλογές Docker και make έτσι ώστε να μπορείτε να εκτελέσετε την εντολή make σε ένα περιβάλλον Docker.
Η εκτέλεση όπως η xlate -GC
θα εκκινήσει ένα κέλυφος με το τρέχον αποθετήριο git που έχει προσαρτηθεί.
Διαβάστε το ιαπωνικό άρθρο στην ενότητα "ΔΕΙΤΕ ΕΠΙΣΗΣ" για λεπτομέρειες.
xlate [ options ] -t lang file [ greple options ]
-h help
-v show version
-d debug
-n dry-run
-a use API
-c just check translation area
-r refresh cache
-s silent mode
-e # translation engine (default "deepl")
-p # pattern to determine translation area
-x # file containing mask patterns
-w # wrap line by # width
-o # output format (default "xtxt", or "cm", "ifdef")
-f # from lang (ignored)
-t # to lang (required, no default)
-m # max length per API call
-l # show library files (XLATE.mk, xlate.el)
-- terminate option parsing
Make options
-M run make
-n dry-run
Docker options
-G mount git top-level directory
-B run in non-interactive (batch) mode
-R mount read-only
-E * specify environment variable to be inherited
-I * docker image name or version (default: tecolicom/xlate:version)
-D * run xlate on the container with the rest parameters
-C * run following command on the container, or run shell
Control Files:
*.LANG translation languates
*.FORMAT translation foramt (xtxt, cm, ifdef, colon, space)
*.ENGINE translation engine (deepl, gpt3, gpt4, gpt4o)
EMACS
Φορτώστε το αρχείο xlate.el που περιλαμβάνεται στο αποθετήριο για να χρησιμοποιήσετε την εντολή xlate
από τον επεξεργαστή Emacs. Η συνάρτηση xlate-region
μεταφράζει την δοθείσα περιοχή. Η προεπιλεγμένη γλώσσα είναι η EN-US
και μπορείτε να καθορίσετε τη γλώσσα καλώντας την με πρόθεμα.
ENVIRONMENT
- DEEPL_AUTH_KEY
-
Ορίστε το κλειδί πιστοποίησης σας για την υπηρεσία DeepL.
- OPENAI_API_KEY
-
Κλειδί επαλήθευσης OpenAI.
INSTALL
CPANMINUS
$ cpanm App::Greple::xlate
TOOLS
Πρέπει να εγκαταστήσετε τα εργαλεία γραμμής εντολών για το DeepL και το ChatGPT.
https://github.com/DeepLcom/deepl-python
https://github.com/tecolicom/App-gpty
SEE ALSO
https://hub.docker.com/r/tecolicom/xlate
Εικόνα εμφιάλωσης Docker.
https://github.com/DeepLcom/deepl-python
Βιβλιοθήκη DeepL Python και εντολή CLI.
https://github.com/openai/openai-python
Βιβλιοθήκη Python της OpenAI
https://github.com/tecolicom/App-gpty
Διεπαφή γραμμής εντολών της OpenAI
-
Δείτε το εγχειρίδιο greple για λεπτομέρειες σχετικά με το πρότυπο κειμένου προορισμού. Χρησιμοποιήστε τις επιλογές --inside, --outside, --include, --exclude για να περιορίσετε την περιοχή της αντιστοίχισης.
-
Μπορείτε να χρησιμοποιήσετε τον μονάδα
-Mupdate
για να τροποποιήσετε αρχεία με βάση το αποτέλεσμα της εντολής greple. -
Χρησιμοποιήστε το sdif για να εμφανίσετε τη μορφή του δείκτη σύγκρουσης δίπλα-δίπλα με την επιλογή -V.
-
Χρήση του μοντέλου Greple stripe με την επιλογή --xlate-stripe.
ARTICLES
https://qiita.com/kaz-utashiro/items/1c1a51a4591922e18250
Μεταφράστε το παρακάτω κείμενο στα Ελληνικά, γραμμή προς γραμμή.
https://qiita.com/kaz-utashiro/items/a5e19736416ca183ecf6
Μονάδα Greple για μετάφραση και αντικατάσταση μόνο των απαραίτητων τμημάτων με το API του DeepL (στα Ιαπωνικά)
https://qiita.com/kaz-utashiro/items/1b9e155d6ae0620ab4dd
Δημιουργία εγγράφων σε 15 γλώσσες με τη μονάδα DeepL API (στα Ιαπωνικά)
AUTHOR
Kazumasa Utashiro
LICENSE
Copyright © 2023-2024 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.