NAME
App::Greple::xlate - ενότητα υποστήριξης μετάφρασης για το greple
SYNOPSIS
greple -Mxlate -e ENGINE --xlate pattern target-file
greple -Mxlate::deepl --xlate pattern target-file
VERSION
Version 0.40
DESCRIPTION
Η ενότητα Greple xlate βρίσκει τα επιθυμητά τμήματα κειμένου και τα αντικαθιστά με το μεταφρασμένο κείμενο. Επί του παρόντος, η ενότητα DeepL (deepl.pm) και η ενότητα ChatGPT (gpt3.pm) υλοποιούνται ως μηχανή back-end. Περιλαμβάνεται επίσης πειραματική υποστήριξη για gpt-4 και gpt-4o.
Αν θέλετε να μεταφράσετε κανονικά μπλοκ κειμένου σε ένα έγγραφο γραμμένο στο στυλ pod της Perl, χρησιμοποιήστε την εντολή greple με την ενότητα xlate::deepl
και perl
ως εξής:
greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm
Στην εντολή αυτή, η συμβολοσειρά προτύπων ^([\w\pP].*\n)+
σημαίνει διαδοχικές γραμμές που αρχίζουν με αλφαριθμητικά και γράμματα στίξης. Αυτή η εντολή δείχνει την περιοχή που πρόκειται να μεταφραστεί επισημασμένη. Η επιλογή --all χρησιμοποιείται για την παραγωγή ολόκληρου του κειμένου.
Στη συνέχεια, προσθέστε την επιλογή --xlate
για να μεταφράσετε την επιλεγμένη περιοχή. Στη συνέχεια, θα βρει τα επιθυμητά τμήματα και θα τα αντικαταστήσει με την έξοδο της εντολής deepl.
Από προεπιλογή, το πρωτότυπο και το μεταφρασμένο κείμενο εκτυπώνονται σε μορφή "conflict marker" συμβατή με το git(1). Χρησιμοποιώντας τη μορφή ifdef
, μπορείτε να πάρετε εύκολα το επιθυμητό μέρος με την εντολή unifdef(1). Η μορφή εξόδου μπορεί να καθοριστεί με την επιλογή --xlate-format.
Αν θέλετε να μεταφράσετε ολόκληρο το κείμενο, χρησιμοποιήστε την επιλογή --match-all. Αυτή είναι μια σύντομη διαδρομή για να καθορίσετε το μοτίβο (?s).+
που ταιριάζει σε ολόκληρο το κείμενο.
Τα δεδομένα μορφής δείκτη σύγκρουσης μπορούν να προβληθούν σε στυλ side-by-side με την εντολή sdif
με την επιλογή -V
. Δεδομένου ότι δεν έχει νόημα η σύγκριση ανά συμβολοσειρά, συνιστάται η επιλογή --no-cdif
. Αν δεν χρειάζεται να χρωματίσετε το κείμενο, καθορίστε την επιλογή --no-textcolor
(ή --no-tc
).
sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm
NORMALIZATION
Η επεξεργασία γίνεται σε καθορισμένες μονάδες, αλλά στην περίπτωση μιας ακολουθίας πολλαπλών γραμμών μη κενού κειμένου, μετατρέπονται όλες μαζί σε μια ενιαία γραμμή. Η λειτουργία αυτή εκτελείται ως εξής:
Αφαίρεση του λευκού χώρου στην αρχή και στο τέλος κάθε γραμμής.
Εάν μια γραμμή τελειώνει με χαρακτήρα στίξης πλήρους πλάτους, συνένωση με την επόμενη γραμμή.
Εάν μια γραμμή τελειώνει με χαρακτήρα πλήρους πλάτους και η επόμενη γραμμή αρχίζει με χαρακτήρα πλήρους πλάτους, συνενώστε τις γραμμές.
Εάν είτε το τέλος είτε η αρχή μιας γραμμής δεν είναι χαρακτήρας πλήρους πλάτους, συνδέστε τις με την εισαγωγή ενός χαρακτήρα κενό.
Η διαχείριση των δεδομένων προσωρινής αποθήκευσης γίνεται με βάση το κανονικοποιημένο κείμενο, οπότε ακόμη και αν γίνουν τροποποιήσεις που δεν επηρεάζουν τα αποτελέσματα της κανονικοποίησης, τα δεδομένα μετάφρασης που έχουν αποθηκευτεί στην προσωρινή μνήμη θα εξακολουθήσουν να ισχύουν.
Αυτή η διαδικασία κανονικοποίησης εκτελείται μόνο για το πρώτο (0ο) και το ζυγό πρότυπο. Έτσι, αν καθοριστούν δύο πρότυπα ως εξής, το κείμενο που ταιριάζει στο πρώτο πρότυπο θα υποβληθεί σε επεξεργασία μετά την κανονικοποίηση και δεν θα εκτελεστεί καμία διαδικασία κανονικοποίησης στο κείμενο που ταιριάζει στο δεύτερο πρότυπο.
greple -Mxlate -E normalized -E not-normalized
Επομένως, χρησιμοποιήστε το πρώτο μοτίβο για κείμενο που πρόκειται να υποστεί επεξεργασία με συνδυασμό πολλών γραμμών σε μία γραμμή και χρησιμοποιήστε το δεύτερο μοτίβο για προ-διαμορφωμένο κείμενο. Εάν δεν υπάρχει κείμενο προς αντιστοίχιση στο πρώτο μοτίβο, τότε ένα μοτίβο που δεν ταιριάζει με τίποτα, όπως (;!)
.
MASKING
Περιστασιακά, υπάρχουν τμήματα κειμένου που δεν θέλετε να μεταφραστούν. Για παράδειγμα, ετικέτες σε αρχεία markdown. Το DeepL προτείνει σε τέτοιες περιπτώσεις, το τμήμα του κειμένου που θα εξαιρεθεί να μετατραπεί σε ετικέτες XML, να μεταφραστεί και στη συνέχεια να αποκατασταθεί μετά την ολοκλήρωση της μετάφρασης. Για να υποστηριχθεί αυτό, είναι δυνατό να καθορίσετε τα μέρη που θα αποκρύπτονται από τη μετάφραση.
--xlate-setopt maskfile=MASKPATTERN
Αυτό θα ερμηνεύσει κάθε γραμμή του αρχείου `MASKPATTERN` ως μια κανονική έκφραση, θα μεταφράσει τις συμβολοσειρές που ταιριάζουν σε αυτήν και θα επανέλθει μετά την επεξεργασία. Οι γραμμές που αρχίζουν με #
αγνοούνται.
Το σύνθετο μοτίβο μπορεί να γραφτεί σε πολλαπλές γραμμές με backslash escpaed newline.
Το πώς μετασχηματίζεται το κείμενο με τη μάσκα μπορεί να φανεί με την επιλογή --xlate-mask.
Αυτή η διεπαφή είναι πειραματική και μπορεί να αλλάξει στο μέλλον.
OPTIONS
- --xlate
- --xlate-color
- --xlate-fold
- --xlate-fold-width=n (Default: 70)
-
Προκαλέστε τη διαδικασία μετάφρασης για κάθε περιοχή που ταιριάζει.
Χωρίς αυτή την επιλογή, η greple συμπεριφέρεται ως κανονική εντολή αναζήτησης. Έτσι, μπορείτε να ελέγξετε ποιο τμήμα του αρχείου θα αποτελέσει αντικείμενο της μετάφρασης πριν από την επίκληση της πραγματικής εργασίας.
Το αποτέλεσμα της εντολής πηγαίνει στην τυπική έξοδο, οπότε ανακατευθύνετε σε αρχείο αν είναι απαραίτητο, ή σκεφτείτε να χρησιμοποιήσετε την ενότητα App::Greple::update.
Η επιλογή --xlate καλεί την επιλογή --xlate-color με την επιλογή --color=never.
Με την επιλογή --xlate-fold, το μετατρεπόμενο κείμενο διπλώνεται κατά το καθορισμένο πλάτος. Το προεπιλεγμένο πλάτος είναι 70 και μπορεί να οριστεί με την επιλογή --xlate-fold-width. Τέσσερις στήλες είναι δεσμευμένες για τη λειτουργία run-in, οπότε κάθε γραμμή μπορεί να περιέχει 74 χαρακτήρες το πολύ.
- --xlate-engine=engine
-
Καθορίζει τη μηχανή μετάφρασης που θα χρησιμοποιηθεί. Αν καθορίσετε απευθείας τη μονάδα μηχανής, όπως
-Mxlate::deepl
, δεν χρειάζεται να χρησιμοποιήσετε αυτή την επιλογή.Αυτή τη στιγμή, οι ακόλουθες μηχανές είναι διαθέσιμες
deepl: DeepL API
gpt3: gpt-3.5-turbo
gpt4: gpt-4-turbo
gpt4o: gpt-4o-mini
Η διεπαφή του gpt-4o είναι ασταθής και δεν μπορεί να εγγυηθεί ότι θα λειτουργεί σωστά αυτή τη στιγμή.
- --xlate-labor
- --xlabor
-
Αντί να καλείτε τη μηχανή μετάφρασης, αναμένεται να εργαστείτε για. Μετά την προετοιμασία του προς μετάφραση κειμένου, αντιγράφονται στο πρόχειρο. Αναμένεται να τα επικολλήσετε στη φόρμα, να αντιγράψετε το αποτέλεσμα στο πρόχειρο και να πατήσετε return.
- --xlate-to (Default:
EN-US
) -
Καθορίστε τη γλώσσα-στόχο. Μπορείτε να λάβετε τις διαθέσιμες γλώσσες με την εντολή
deepl languages
όταν χρησιμοποιείτε τη μηχανή DeepL. - --xlate-format=format (Default:
conflict
) -
Καθορίστε τη μορφή εξόδου για το αρχικό και το μεταφρασμένο κείμενο.
Οι ακόλουθες μορφές εκτός από το
xtxt
υποθέτουν ότι το προς μετάφραση τμήμα είναι μια συλλογή γραμμών. Στην πραγματικότητα, είναι δυνατόν να μεταφραστεί μόνο ένα τμήμα μιας γραμμής, και ο προσδιορισμός μιας μορφής διαφορετικής από τηνxtxt
δεν θα παράγει ουσιαστικά αποτελέσματα.- conflict, cm
-
Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή δείκτη σύγκρουσης git(1).
<<<<<<< ORIGINAL original text ======= translated Japanese text >>>>>>> JA
Μπορείτε να ανακτήσετε το αρχικό αρχείο με την επόμενη εντολή sed(1).
sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
- colon, :::::::
-
Το αρχικό και το μετασχηματισμένο κείμενο εκτυπώνονται με τη σημειογραφία μπλοκ markdown div.
::::::: ORIGINAL original text ::::::: ::::::: JA translated Japanese text :::::::
Αυτό σημαίνει ότι:
<div class="ORIGINAL"> original text </div> <div class="JA"> translated Japanese text </div>
Ο αριθμός των άνω και κάτω τελεία είναι 7 από προεπιλογή. Εάν καθορίσετε ακολουθία άνω και κάτω τελεία όπως
:::::
, χρησιμοποιείται αντί για 7 άνω και κάτω τελεία. - ifdef
-
Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή cpp(1)
#ifdef
.#ifdef ORIGINAL original text #endif #ifdef JA translated Japanese text #endif
Μπορείτε να ανακτήσετε μόνο το ιαπωνικό κείμενο με την εντολή unifdef:
unifdef -UORIGINAL -DJA foo.ja.pm
- space
- space+
-
Το πρωτότυπο και το μετατρεπόμενο κείμενο εκτυπώνονται χωριστά με μία κενή γραμμή. Για το
space+
, εκτυπώνεται επίσης μια νέα γραμμή μετά το μετασχηματισμένο κείμενο. - xtxt
-
Εάν η μορφή είναι
xtxt
(μεταφρασμένο κείμενο) ή άγνωστη, εκτυπώνεται μόνο το μεταφρασμένο κείμενο.
- --xlate-maxlen=chars (Default: 0)
-
Καθορίστε το μέγιστο μήκος του κειμένου που θα αποσταλεί στο API ταυτόχρονα. Η προεπιλεγμένη τιμή έχει οριστεί όπως για τη δωρεάν υπηρεσία λογαριασμού DeepL: 128K για το API (--xlate) και 5000 για τη διεπαφή πρόχειρου (--xlate-labor). Μπορεί να μπορείτε να αλλάξετε αυτές τις τιμές αν χρησιμοποιείτε την υπηρεσία Pro.
- --xlate-maxline=n (Default: 0)
-
Καθορίστε τις μέγιστες γραμμές κειμένου που θα αποστέλλονται ταυτόχρονα στο API.
Ορίστε αυτή την τιμή σε 1 αν θέλετε να μεταφράζετε μία γραμμή κάθε φορά. Αυτή η επιλογή υπερισχύει της επιλογής
--xlate-maxlen
. - --[no-]xlate-progress (Default: True)
-
Δείτε το αποτέλεσμα της μετάφρασης σε πραγματικό χρόνο στην έξοδο STDERR.
- --xlate-stripe
-
Χρησιμοποιήστε την ενότητα App::Greple::stripe για να εμφανίσετε το αντιστοιχισμένο τμήμα με τον τρόπο της λωρίδας ζέβρας. Αυτό είναι χρήσιμο όταν τα αντιστοιχισμένα μέρη συνδέονται πλάτη με πλάτη.
Η παλέτα χρωμάτων αλλάζει ανάλογα με το χρώμα φόντου του τερματικού. Αν θέλετε να το καθορίσετε ρητά, μπορείτε να χρησιμοποιήσετε --xlate-stripe-light ή --xlate-stripe-dark.
- --xlate-mask
-
Εκτελέστε τη λειτουργία μάσκας και εμφανίστε το μετασχηματισμένο κείμενο ως έχει χωρίς αποκατάσταση.
- --match-all
-
Ορίστε ολόκληρο το κείμενο του αρχείου ως περιοχή-στόχο.
CACHE OPTIONS
Η ενότητα xlate μπορεί να αποθηκεύσει το αποθηκευμένο κείμενο της μετάφρασης για κάθε αρχείο και να το διαβάσει πριν από την εκτέλεση, ώστε να εξαλειφθεί η επιβάρυνση από την ερώτηση στον διακομιστή. Με την προεπιλεγμένη στρατηγική κρυφής μνήμης auto
, διατηρεί τα δεδομένα της κρυφής μνήμης μόνο όταν το αρχείο κρυφής μνήμης υπάρχει για το αρχείο-στόχο.
Χρησιμοποιήστε το --xlate-cache=clear για να ξεκινήσετε τη διαχείριση της κρυφής μνήμης ή για να καθαρίσετε όλα τα υπάρχοντα δεδομένα της κρυφής μνήμης. Μόλις εκτελεστεί με αυτή την επιλογή, θα δημιουργηθεί ένα νέο αρχείο cache, αν δεν υπάρχει, και στη συνέχεια θα διατηρηθεί αυτόματα.
- --xlate-cache=strategy
-
auto
(Default)-
Διατήρηση του αρχείου κρυφής μνήμης εάν υπάρχει.
create
-
Δημιουργεί κενό αρχείο κρυφής μνήμης και τερματίζει.
always
,yes
,1
-
Διατηρεί την κρυφή μνήμη ούτως ή άλλως εφόσον ο στόχος είναι κανονικό αρχείο.
clear
-
Καθαρίστε πρώτα τα δεδομένα της κρυφής μνήμης.
never
,no
,0
-
Δεν χρησιμοποιεί ποτέ το αρχείο κρυφής μνήμης ακόμη και αν υπάρχει.
accumulate
-
Σύμφωνα με την προεπιλεγμένη συμπεριφορά, τα αχρησιμοποίητα δεδομένα αφαιρούνται από το αρχείο προσωρινής αποθήκευσης. Αν δεν θέλετε να τα αφαιρέσετε και να τα διατηρήσετε στο αρχείο, χρησιμοποιήστε το
accumulate
.
- --xlate-update
-
Αυτή η επιλογή επιβάλλει την ενημέρωση του αρχείου cache ακόμη και αν δεν είναι απαραίτητο.
COMMAND LINE INTERFACE
Μπορείτε εύκολα να χρησιμοποιήσετε αυτήν την ενότητα από τη γραμμή εντολών χρησιμοποιώντας την εντολή xlate
που περιλαμβάνεται στη διανομή. Ανατρέξτε στις πληροφορίες βοήθειας της xlate
για τη χρήση.
Η εντολή xlate
λειτουργεί σε συνεργασία με το περιβάλλον Docker, οπότε ακόμα και αν δεν έχετε τίποτα εγκατεστημένο στο χέρι, μπορείτε να τη χρησιμοποιήσετε εφόσον το Docker είναι διαθέσιμο. Χρησιμοποιήστε την επιλογή -D
ή -C
.
Επίσης, δεδομένου ότι παρέχονται makefiles για διάφορα στυλ εγγράφων, η μετάφραση σε άλλες γλώσσες είναι δυνατή χωρίς ειδικές προδιαγραφές. Χρησιμοποιήστε την επιλογή -M
.
Μπορείτε επίσης να συνδυάσετε τις επιλογές Docker και make, ώστε να μπορείτε να εκτελέσετε το make σε περιβάλλον Docker.
Εκτελώντας το όπως το xlate -GC
θα ξεκινήσει ένα κέλυφος με το τρέχον αποθετήριο git που λειτουργεί συνδεδεμένο.
Διαβάστε το ιαπωνικό άρθρο στην ενότητα "SEE ALSO" για λεπτομέρειες.
xlate [ options ] -t lang file [ greple options ]
-h help
-v show version
-d debug
-n dry-run
-a use API
-c just check translation area
-r refresh cache
-s silent mode
-e # translation engine (default "deepl")
-p # pattern to determine translation area
-w # wrap line by # width
-o # output format (default "xtxt", or "cm", "ifdef")
-f # from lang (ignored)
-t # to lang (required, no default)
-m # max length per API call
-l # show library files (XLATE.mk, xlate.el)
-- terminate option parsing
Make options
-M run make
-n dry-run
Docker options
-G mount git top-level directory
-B run in non-interactive (batch) mode
-R mount read-only
-E * specify environment variable to be inherited
-I * specify altanative docker image (default: tecolicom/xlate:version)
-D * run xlate on the container with the rest parameters
-C * run following command on the container, or run shell
Control Files:
*.LANG translation languates
*.FORMAT translation foramt (xtxt, cm, ifdef)
*.ENGINE translation engine (deepl or gpt3)
EMACS
Φορτώστε το αρχείο xlate.el που περιλαμβάνεται στο αποθετήριο για να χρησιμοποιήσετε την εντολή xlate
από τον επεξεργαστή Emacs. Η συνάρτηση xlate-region
μεταφράζει τη δεδομένη περιοχή. Η προεπιλεγμένη γλώσσα είναι η EN-US
και μπορείτε να καθορίσετε τη γλώσσα που θα την καλέσετε με το όρισμα prefix.
ENVIRONMENT
- DEEPL_AUTH_KEY
-
Ορίστε το κλειδί ελέγχου ταυτότητας για την υπηρεσία DeepL.
- OPENAI_API_KEY
-
Κλειδί ελέγχου ταυτότητας OpenAI.
INSTALL
CPANMINUS
$ cpanm App::Greple::xlate
TOOLS
Πρέπει να εγκαταστήσετε τα εργαλεία γραμμής εντολών για τα DeepL και ChatGPT.
https://github.com/DeepLcom/deepl-python
https://github.com/tecolicom/App-gpty
SEE ALSO
https://hub.docker.com/r/tecolicom/xlate
Εικόνα εμπορευματοκιβωτίου Docker.
https://github.com/DeepLcom/deepl-python
DeepL βιβλιοθήκη Python και εντολή CLI.
https://github.com/openai/openai-python
Βιβλιοθήκη OpenAI Python
https://github.com/tecolicom/App-gpty
Διεπαφή γραμμής εντολών OpenAI
-
Ανατρέξτε στο εγχειρίδιο greple για λεπτομέρειες σχετικά με το μοτίβο κειμένου-στόχου. Χρησιμοποιήστε τις επιλογές --inside, --outside, --include, --exclude για να περιορίσετε την περιοχή αντιστοίχισης.
-
Μπορείτε να χρησιμοποιήσετε την ενότητα
-Mupdate
για να τροποποιήσετε αρχεία με βάση το αποτέλεσμα της εντολής greple. -
Χρησιμοποιήστε την εντολή sdif για να εμφανίσετε τη μορφή του δείκτη σύγκρουσης δίπλα-δίπλα με την επιλογή -V.
-
Greple stripe χρήση της μονάδας --xlate-stripe με την επιλογή --xlate-stripe.
ARTICLES
https://qiita.com/kaz-utashiro/items/1c1a51a4591922e18250
Μονάδα Greple για τη μετάφραση και την αντικατάσταση μόνο των απαραίτητων τμημάτων με το DeepL API (στα ιαπωνικά)
https://qiita.com/kaz-utashiro/items/a5e19736416ca183ecf6
Δημιουργία εγγράφων σε 15 γλώσσες με την ενότητα DeepL API (στα ιαπωνικά)
https://qiita.com/kaz-utashiro/items/1b9e155d6ae0620ab4dd
Αυτόματη μετάφραση περιβάλλοντος Docker με DeepL API (στα ιαπωνικά)
AUTHOR
Kazumasa Utashiro
LICENSE
Copyright © 2023-2024 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.