NAME

App::Greple::xlate - ενότητα υποστήριξης μετάφρασης για το greple

SYNOPSIS

greple -Mxlate -e ENGINE --xlate pattern target-file

greple -Mxlate::deepl --xlate pattern target-file

VERSION

Version 0.9901

DESCRIPTION

Η ενότητα Greple xlate βρίσκει τα επιθυμητά τμήματα κειμένου και τα αντικαθιστά με το μεταφρασμένο κείμενο. Επί του παρόντος, η ενότητα DeepL (deepl.pm) και η ενότητα ChatGPT (gpt3.pm) υλοποιούνται ως μηχανή back-end. Περιλαμβάνεται επίσης πειραματική υποστήριξη για gpt-4 και gpt-4o.

Αν θέλετε να μεταφράσετε κανονικά μπλοκ κειμένου σε ένα έγγραφο γραμμένο στο στυλ pod της Perl, χρησιμοποιήστε την εντολή greple με την ενότητα xlate::deepl και perl ως εξής:

greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm

Στην εντολή αυτή, η συμβολοσειρά προτύπων ^([\w\pP].*\n)+ σημαίνει διαδοχικές γραμμές που αρχίζουν με αλφαριθμητικά και γράμματα στίξης. Αυτή η εντολή δείχνει την περιοχή που πρόκειται να μεταφραστεί επισημασμένη. Η επιλογή --all χρησιμοποιείται για την παραγωγή ολόκληρου του κειμένου.

Στη συνέχεια, προσθέστε την επιλογή --xlate για να μεταφράσετε την επιλεγμένη περιοχή. Στη συνέχεια, θα βρει τα επιθυμητά τμήματα και θα τα αντικαταστήσει με την έξοδο της εντολής deepl.

Από προεπιλογή, το πρωτότυπο και το μεταφρασμένο κείμενο εκτυπώνονται σε μορφή "conflict marker" συμβατή με το git(1). Χρησιμοποιώντας τη μορφή ifdef, μπορείτε να πάρετε εύκολα το επιθυμητό μέρος με την εντολή unifdef(1). Η μορφή εξόδου μπορεί να καθοριστεί με την επιλογή --xlate-format.

Αν θέλετε να μεταφράσετε ολόκληρο το κείμενο, χρησιμοποιήστε την επιλογή --match-all. Αυτή είναι μια σύντομη διαδρομή για να καθορίσετε το μοτίβο (?s).+ που ταιριάζει σε ολόκληρο το κείμενο.

Τα δεδομένα μορφής δείκτη σύγκρουσης μπορούν να προβληθούν σε στυλ side-by-side με την εντολή sdif με την επιλογή -V. Δεδομένου ότι δεν έχει νόημα η σύγκριση ανά συμβολοσειρά, συνιστάται η επιλογή --no-cdif. Αν δεν χρειάζεται να χρωματίσετε το κείμενο, καθορίστε την επιλογή --no-textcolor--no-tc).

sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

Η επεξεργασία γίνεται σε καθορισμένες μονάδες, αλλά στην περίπτωση μιας ακολουθίας πολλαπλών γραμμών μη κενού κειμένου, μετατρέπονται όλες μαζί σε μια ενιαία γραμμή. Η λειτουργία αυτή εκτελείται ως εξής:

  • Αφαίρεση του λευκού χώρου στην αρχή και στο τέλος κάθε γραμμής.

  • Εάν μια γραμμή τελειώνει με χαρακτήρα στίξης πλήρους πλάτους, συνένωση με την επόμενη γραμμή.

  • Εάν μια γραμμή τελειώνει με χαρακτήρα πλήρους πλάτους και η επόμενη γραμμή αρχίζει με χαρακτήρα πλήρους πλάτους, συνενώστε τις γραμμές.

  • Εάν είτε το τέλος είτε η αρχή μιας γραμμής δεν είναι χαρακτήρας πλήρους πλάτους, συνδέστε τις με την εισαγωγή ενός χαρακτήρα κενό.

Η διαχείριση των δεδομένων προσωρινής αποθήκευσης γίνεται με βάση το κανονικοποιημένο κείμενο, οπότε ακόμη και αν γίνουν τροποποιήσεις που δεν επηρεάζουν τα αποτελέσματα της κανονικοποίησης, τα δεδομένα μετάφρασης που έχουν αποθηκευτεί στην προσωρινή μνήμη θα εξακολουθήσουν να ισχύουν.

Αυτή η διαδικασία κανονικοποίησης εκτελείται μόνο για το πρώτο (0ο) και το ζυγό πρότυπο. Έτσι, αν καθοριστούν δύο πρότυπα ως εξής, το κείμενο που ταιριάζει στο πρώτο πρότυπο θα υποβληθεί σε επεξεργασία μετά την κανονικοποίηση και δεν θα εκτελεστεί καμία διαδικασία κανονικοποίησης στο κείμενο που ταιριάζει στο δεύτερο πρότυπο.

greple -Mxlate -E normalized -E not-normalized

Επομένως, χρησιμοποιήστε το πρώτο μοτίβο για κείμενο που πρόκειται να υποστεί επεξεργασία συνδυάζοντας πολλές γραμμές σε μία γραμμή και χρησιμοποιήστε το δεύτερο μοτίβο για προ-διαμορφωμένο κείμενο. Εάν δεν υπάρχει κείμενο προς αντιστοίχιση στο πρώτο μοτίβο, χρησιμοποιήστε ένα μοτίβο που δεν ταιριάζει με τίποτα, όπως (?!).

MASKING

Περιστασιακά, υπάρχουν τμήματα κειμένου που δεν θέλετε να μεταφραστούν. Για παράδειγμα, ετικέτες σε αρχεία markdown. Το DeepL προτείνει σε τέτοιες περιπτώσεις, το τμήμα του κειμένου που θα εξαιρεθεί να μετατραπεί σε ετικέτες XML, να μεταφραστεί και στη συνέχεια να αποκατασταθεί μετά την ολοκλήρωση της μετάφρασης. Για να υποστηριχθεί αυτό, είναι δυνατό να καθορίσετε τα μέρη που θα αποκρύπτονται από τη μετάφραση.

--xlate-setopt maskfile=MASKPATTERN

Αυτό θα ερμηνεύσει κάθε γραμμή του αρχείου `MASKPATTERN` ως μια κανονική έκφραση, θα μεταφράσει τις συμβολοσειρές που ταιριάζουν σε αυτήν και θα επανέλθει μετά την επεξεργασία. Οι γραμμές που αρχίζουν με # αγνοούνται.

Το σύνθετο μοτίβο μπορεί να γραφτεί σε πολλαπλές γραμμές με backslash escpaed newline.

Το πώς μετασχηματίζεται το κείμενο με τη μάσκα μπορεί να φανεί με την επιλογή --xlate-mask.

Αυτή η διεπαφή είναι πειραματική και μπορεί να αλλάξει στο μέλλον.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

Προκαλέστε τη διαδικασία μετάφρασης για κάθε περιοχή που ταιριάζει.

Χωρίς αυτή την επιλογή, η greple συμπεριφέρεται ως κανονική εντολή αναζήτησης. Έτσι, μπορείτε να ελέγξετε ποιο τμήμα του αρχείου θα αποτελέσει αντικείμενο της μετάφρασης πριν από την επίκληση της πραγματικής εργασίας.

Το αποτέλεσμα της εντολής πηγαίνει στην τυπική έξοδο, οπότε ανακατευθύνετε σε αρχείο αν είναι απαραίτητο, ή σκεφτείτε να χρησιμοποιήσετε την ενότητα App::Greple::update.

Η επιλογή --xlate καλεί την επιλογή --xlate-color με την επιλογή --color=never.

Με την επιλογή --xlate-fold, το μετατρεπόμενο κείμενο διπλώνεται κατά το καθορισμένο πλάτος. Το προεπιλεγμένο πλάτος είναι 70 και μπορεί να οριστεί με την επιλογή --xlate-fold-width. Τέσσερις στήλες είναι δεσμευμένες για τη λειτουργία run-in, οπότε κάθε γραμμή μπορεί να περιέχει 74 χαρακτήρες το πολύ.

--xlate-engine=engine

Καθορίζει τη μηχανή μετάφρασης που θα χρησιμοποιηθεί. Αν καθορίσετε απευθείας τη μονάδα μηχανής, όπως -Mxlate::deepl, δεν χρειάζεται να χρησιμοποιήσετε αυτή την επιλογή.

Αυτή τη στιγμή, οι ακόλουθες μηχανές είναι διαθέσιμες

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4-turbo

  • gpt4o: gpt-4o-mini

    Η διεπαφή του gpt-4o είναι ασταθής και δεν μπορεί να εγγυηθεί ότι θα λειτουργεί σωστά αυτή τη στιγμή.

--xlate-labor
--xlabor

Αντί να καλείτε τη μηχανή μετάφρασης, αναμένεται να εργαστείτε για. Μετά την προετοιμασία του προς μετάφραση κειμένου, αντιγράφονται στο πρόχειρο. Αναμένεται να τα επικολλήσετε στη φόρμα, να αντιγράψετε το αποτέλεσμα στο πρόχειρο και να πατήσετε return.

--xlate-to (Default: EN-US)

Καθορίστε τη γλώσσα-στόχο. Μπορείτε να λάβετε τις διαθέσιμες γλώσσες με την εντολή deepl languages όταν χρησιμοποιείτε τη μηχανή DeepL.

--xlate-format=format (Default: conflict)

Καθορίστε τη μορφή εξόδου για το αρχικό και το μεταφρασμένο κείμενο.

Οι ακόλουθες μορφές εκτός από το xtxt υποθέτουν ότι το προς μετάφραση τμήμα είναι μια συλλογή γραμμών. Στην πραγματικότητα, είναι δυνατόν να μεταφραστεί μόνο ένα τμήμα μιας γραμμής, και ο προσδιορισμός μιας μορφής διαφορετικής από την xtxt δεν θα παράγει ουσιαστικά αποτελέσματα.

conflict, cm

Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή δείκτη σύγκρουσης git(1).

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

Μπορείτε να ανακτήσετε το αρχικό αρχείο με την επόμενη εντολή sed(1).

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

Το πρωτότυπο και το μεταφρασμένο κείμενο εξάγονται με το προσαρμοσμένο στυλ δοχείου markdown.

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

Το παραπάνω κείμενο θα μεταφραστεί στα ακόλουθα σε HTML.

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

Ο αριθμός των άνω και κάτω τελεία είναι 7 από προεπιλογή. Εάν καθορίσετε ακολουθία άνω και κάτω τελεία όπως :::::, χρησιμοποιείται αντί για 7 άνω και κάτω τελεία.

ifdef

Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή cpp(1) #ifdef.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

Μπορείτε να ανακτήσετε μόνο το ιαπωνικό κείμενο με την εντολή unifdef:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

Το πρωτότυπο και το μετατρεπόμενο κείμενο εκτυπώνονται χωριστά με μία κενή γραμμή. Για το space+, εκτυπώνεται επίσης μια νέα γραμμή μετά το μετασχηματισμένο κείμενο.

xtxt

Εάν η μορφή είναι xtxt (μεταφρασμένο κείμενο) ή άγνωστη, εκτυπώνεται μόνο το μεταφρασμένο κείμενο.

--xlate-maxlen=chars (Default: 0)

Καθορίστε το μέγιστο μήκος του κειμένου που θα αποσταλεί στο API ταυτόχρονα. Η προεπιλεγμένη τιμή έχει οριστεί όπως για τη δωρεάν υπηρεσία λογαριασμού DeepL: 128K για το API (--xlate) και 5000 για τη διεπαφή πρόχειρου (--xlate-labor). Μπορεί να μπορείτε να αλλάξετε αυτές τις τιμές αν χρησιμοποιείτε την υπηρεσία Pro.

--xlate-maxline=n (Default: 0)

Καθορίστε τις μέγιστες γραμμές κειμένου που θα αποστέλλονται ταυτόχρονα στο API.

Ορίστε αυτή την τιμή σε 1 αν θέλετε να μεταφράζετε μία γραμμή κάθε φορά. Αυτή η επιλογή υπερισχύει της επιλογής --xlate-maxlen.

--[no-]xlate-progress (Default: True)

Δείτε το αποτέλεσμα της μετάφρασης σε πραγματικό χρόνο στην έξοδο STDERR.

--xlate-stripe

Χρησιμοποιήστε την ενότητα App::Greple::stripe για να εμφανίσετε το αντιστοιχισμένο τμήμα με τον τρόπο της λωρίδας ζέβρας. Αυτό είναι χρήσιμο όταν τα αντιστοιχισμένα μέρη συνδέονται πλάτη με πλάτη.

Η παλέτα χρωμάτων αλλάζει ανάλογα με το χρώμα φόντου του τερματικού. Αν θέλετε να το καθορίσετε ρητά, μπορείτε να χρησιμοποιήσετε --xlate-stripe-light ή --xlate-stripe-dark.

--xlate-mask

Εκτελέστε τη λειτουργία μάσκας και εμφανίστε το μετασχηματισμένο κείμενο ως έχει χωρίς αποκατάσταση.

--match-all

Ορίστε ολόκληρο το κείμενο του αρχείου ως περιοχή-στόχο.

CACHE OPTIONS

Η ενότητα xlate μπορεί να αποθηκεύσει το αποθηκευμένο κείμενο της μετάφρασης για κάθε αρχείο και να το διαβάσει πριν από την εκτέλεση, ώστε να εξαλειφθεί η επιβάρυνση από την ερώτηση στον διακομιστή. Με την προεπιλεγμένη στρατηγική κρυφής μνήμης auto, διατηρεί τα δεδομένα της κρυφής μνήμης μόνο όταν το αρχείο κρυφής μνήμης υπάρχει για το αρχείο-στόχο.

Χρησιμοποιήστε το --xlate-cache=clear για να ξεκινήσετε τη διαχείριση της κρυφής μνήμης ή για να καθαρίσετε όλα τα υπάρχοντα δεδομένα της κρυφής μνήμης. Μόλις εκτελεστεί με αυτή την επιλογή, θα δημιουργηθεί ένα νέο αρχείο cache, αν δεν υπάρχει, και στη συνέχεια θα διατηρηθεί αυτόματα.

--xlate-cache=strategy
auto (Default)

Διατήρηση του αρχείου κρυφής μνήμης εάν υπάρχει.

create

Δημιουργεί κενό αρχείο κρυφής μνήμης και τερματίζει.

always, yes, 1

Διατηρεί την κρυφή μνήμη ούτως ή άλλως εφόσον ο στόχος είναι κανονικό αρχείο.

clear

Καθαρίστε πρώτα τα δεδομένα της κρυφής μνήμης.

never, no, 0

Δεν χρησιμοποιεί ποτέ το αρχείο κρυφής μνήμης ακόμη και αν υπάρχει.

accumulate

Σύμφωνα με την προεπιλεγμένη συμπεριφορά, τα αχρησιμοποίητα δεδομένα αφαιρούνται από το αρχείο προσωρινής αποθήκευσης. Αν δεν θέλετε να τα αφαιρέσετε και να τα διατηρήσετε στο αρχείο, χρησιμοποιήστε το accumulate.

--xlate-update

Αυτή η επιλογή επιβάλλει την ενημέρωση του αρχείου cache ακόμη και αν δεν είναι απαραίτητο.

COMMAND LINE INTERFACE

Μπορείτε εύκολα να χρησιμοποιήσετε αυτήν την ενότητα από τη γραμμή εντολών χρησιμοποιώντας την εντολή xlate που περιλαμβάνεται στη διανομή. Ανατρέξτε στη σελίδα man xlate για τη χρήση.

Η εντολή xlate λειτουργεί σε συνεργασία με το περιβάλλον Docker, οπότε ακόμα και αν δεν έχετε τίποτα εγκατεστημένο στο χέρι, μπορείτε να τη χρησιμοποιήσετε εφόσον το Docker είναι διαθέσιμο. Χρησιμοποιήστε την επιλογή -D ή -C.

Επίσης, δεδομένου ότι παρέχονται makefiles για διάφορα στυλ εγγράφων, η μετάφραση σε άλλες γλώσσες είναι δυνατή χωρίς ειδικές προδιαγραφές. Χρησιμοποιήστε την επιλογή -M.

Μπορείτε επίσης να συνδυάσετε τις επιλογές Docker και make, ώστε να μπορείτε να εκτελέσετε το make σε περιβάλλον Docker.

Εκτελώντας το όπως το xlate -GC θα ξεκινήσει ένα κέλυφος με το τρέχον αποθετήριο git που λειτουργεί συνδεδεμένο.

Διαβάστε το ιαπωνικό άρθρο στην ενότητα "SEE ALSO" για λεπτομέρειες.

xlate [ options ] -t lang file [ greple options ]
    -h   help
    -v   show version
    -d   debug
    -n   dry-run
    -a   use API
    -c   just check translation area
    -r   refresh cache
    -u   force update cache
    -s   silent mode
    -e # translation engine (*deepl, gpt3, gpt4, gpt4o)
    -p # pattern to determine translation area
    -x # file containing mask patterns
    -w # wrap line by # width
    -o # output format (*xtxt, cm, ifdef, space, space+, colon)
    -f # from lang (ignored)
    -t # to lang (required, no default)
    -m # max length per API call
    -l # show library files (XLATE.mk, xlate.el)
    --   end of option
    N.B. default is marked as *

Make options
    -M   run make
    -n   dry-run

Docker options
    -D * run xlate on the container with the same parameters
    -C * execute following command on the container, or run shell
    -S * start the live container
    -A * attach to the live container
    N.B. -D/-C/-A terminates option handling

    -G   mount git top-level directory
    -H   mount home directory
    -V # specify mount directory
    -U   do not mount
    -R   mount read-only
    -L   do not remove and keep live container
    -K   kill and remove live container
    -E # specify environment variable to be inherited
    -I # docker image or version (default: tecolicom/xlate:version)

Control Files:
    *.LANG    translation languates
    *.FORMAT  translation foramt (xtxt, cm, ifdef, colon, space)
    *.ENGINE  translation engine (deepl, gpt3, gpt4, gpt4o)

EMACS

Φορτώστε το αρχείο xlate.el που περιλαμβάνεται στο αποθετήριο για να χρησιμοποιήσετε την εντολή xlate από τον επεξεργαστή Emacs. Η συνάρτηση xlate-region μεταφράζει τη δεδομένη περιοχή. Η προεπιλεγμένη γλώσσα είναι η EN-US και μπορείτε να καθορίσετε τη γλώσσα που θα την καλέσετε με το όρισμα prefix.

ENVIRONMENT

DEEPL_AUTH_KEY

Ορίστε το κλειδί ελέγχου ταυτότητας για την υπηρεσία DeepL.

OPENAI_API_KEY

Κλειδί ελέγχου ταυτότητας OpenAI.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

Πρέπει να εγκαταστήσετε τα εργαλεία γραμμής εντολών για τα DeepL και ChatGPT.

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

SEE ALSO

App::Greple::xlate

App::Greple::xlate::deepl

App::Greple::xlate::gpt3

  • https://hub.docker.com/r/tecolicom/xlate

    Εικόνα εμπορευματοκιβωτίου Docker.

  • https://github.com/DeepLcom/deepl-python

    DeepL βιβλιοθήκη Python και εντολή CLI.

  • https://github.com/openai/openai-python

    Βιβλιοθήκη OpenAI Python

  • https://github.com/tecolicom/App-gpty

    Διεπαφή γραμμής εντολών OpenAI

  • App::Greple

    Ανατρέξτε στο εγχειρίδιο greple για λεπτομέρειες σχετικά με το μοτίβο κειμένου-στόχου. Χρησιμοποιήστε τις επιλογές --inside, --outside, --include, --exclude για να περιορίσετε την περιοχή αντιστοίχισης.

  • App::Greple::update

    Μπορείτε να χρησιμοποιήσετε την ενότητα -Mupdate για να τροποποιήσετε αρχεία με βάση το αποτέλεσμα της εντολής greple.

  • App::sdif

    Χρησιμοποιήστε την εντολή sdif για να εμφανίσετε τη μορφή του δείκτη σύγκρουσης δίπλα-δίπλα με την επιλογή -V.

  • App::Greple::stripe

    Greple stripe χρήση της μονάδας --xlate-stripe με την επιλογή --xlate-stripe.

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.