NAME

App::Greple::xlate - μονάδα υποστήριξης μετάφρασης για το greple

SYNOPSIS

greple -Mxlate -e ENGINE --xlate pattern target-file

greple -Mxlate::deepl --xlate pattern target-file

VERSION

Version 0.40

DESCRIPTION

Το μοντούλο xlate του Greple εντοπίζει τα επιθυμητά τμήματα κειμένου και τα αντικαθιστά με το μεταφρασμένο κείμενο. Αυτή τη στιγμή, έχουν ενσωματωθεί ως μηχανή πίσω από το σύστημα οι DeepL (deepl.pm) και ChatGPT (gpt3.pm). Πειραματική υποστήριξη για τα gpt-4 και gpt-4o περιλαμβάνεται επίσης.

Εάν θέλετε να μεταφράσετε κανονικά τμήματα κειμένου σε ένα έγγραφο που έχει γραφεί στο στυλ pod της Perl, χρησιμοποιήστε την εντολή greple με το xlate::deepl και το πρόσθετο perl όπως εξής:

greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm

Σε αυτή την εντολή, το πρότυπο συμβολοσειράς ^([\w\pP].*\n)+ σημαίνει διαδοχικές γραμμές που ξεκινούν με αλφαριθμητικούς και σημεία στίξης χαρακτήρες. Αυτή η εντολή εμφανίζει την περιοχή που πρέπει να μεταφραστεί με έντονη ανάδειξη. Η επιλογή --all χρησιμοποιείται για να παράγει ολόκληρο το κείμενο.

Στη συνέχεια, προσθέστε την επιλογή --xlate για να μεταφράσετε την επιλεγμένη περιοχή. Στη συνέχεια, θα εντοπίσει τα επιθυμητά τμήματα και θα τα αντικαταστήσει με την έξοδο της εντολής deepl.

Από προεπιλογή, το αρχικό και το μεταφρασμένο κείμενο εκτυπώνονται στη μορφή "conflict marker" που είναι συμβατή με το git(1). Χρησιμοποιώντας τη μορφή ifdef, μπορείτε να πάρετε το επιθυμητό τμήμα με την εντολή unifdef(1) εύκολα. Η μορφή εξόδου μπορεί να καθοριστεί με την επιλογή --xlate-format.

Εάν θέλετε να μεταφράσετε ολόκληρο το κείμενο, χρησιμοποιήστε την επιλογή --match-all. Αυτό είναι ένας συντομευμένος τρόπος για να καθορίσετε το πρότυπο (?s).+ που ταιριάζει με ολόκληρο το κείμενο.

Τα δεδομένα μορφής δείκτη σύγκρουσης μπορούν να προβληθούν σε στυλ δίπλα-δίπλα με την εντολή sdif με την επιλογή -V. Δεδομένου ότι δεν έχει νόημα η σύγκριση με βάση την κάθε συμβολοσειρά, συνιστάται η επιλογή --no-cdif. Αν δεν χρειάζεστε να χρωματίσετε το κείμενο, καθορίστε το --no-textcolor--no-tc).

sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

Η επεξεργασία γίνεται σε συγκεκριμένες μονάδες, αλλά στην περίπτωση μιας ακολουθίας πολλών γραμμών μη κενού κειμένου, μετατρέπονται μαζί σε μία μόνο γραμμή. Αυτή η λειτουργία εκτελείται ως εξής:

  • Αφαιρέστε τα κενά στην αρχή και στο τέλος κάθε γραμμής.

  • Εάν μια γραμμή τελειώνει με έναν χαρακτήρα στίξης πλήρους πλάτους, ενώστε τη με την επόμενη γραμμή.

  • Αν μια γραμμή τελειώνει με πλήρες χαρακτήρα πλάτους και η επόμενη γραμμή αρχίζει με πλήρες χαρακτήρα πλάτους, ενώστε τις γραμμές.

  • Αν είτε η αρχή είτε το τέλος μιας γραμμής δεν είναι πλήρες χαρακτήρας πλάτους, ενώστε τις εισάγοντας έναν χαρακτήρα κενού.

Τα δεδομένα προσωρινής μνήμης διαχειρίζονται με βάση το κανονικοποιημένο κείμενο, οπότε ακόμα κι αν γίνουν τροποποιήσεις που δεν επηρεάζουν τα αποτελέσματα της κανονικοποίησης, τα δεδομένα μετάφρασης στην προσωρινή μνήμη θα παραμείνουν αποτελεσματικά.

Αυτή η διαδικασία κανονικοποίησης πραγματοποιείται μόνο για το πρώτο (0ο) και το μονού αριθμού πρότυπο. Έτσι, εάν δύο πρότυπα καθοριστούν ως εξής, το κείμενο που ταιριάζει με το πρώτο πρότυπο θα επεξεργαστεί μετά την κανονικοποίηση, και δεν θα πραγματοποιηθεί κανονικοποίηση στο κείμενο που ταιριάζει με το δεύτερο πρότυπο.

greple -Mxlate -E normalized -E not-normalized

Επομένως, χρησιμοποιήστε το πρώτο πρότυπο για κείμενο που πρόκειται να επεξεργαστεί με τη συνδυασμό πολλών γραμμών σε μία μόνο γραμμή, και χρησιμοποιήστε το δεύτερο πρότυπο για προετοιμασμένο κείμενο. Εάν δεν υπάρχει κείμενο που να ταιριάζει με το πρώτο πρότυπο, τότε χρησιμοποιήστε ένα πρότυπο που δεν ταιριάζει με τίποτα, όπως (?!).

MASKING

Μερικές φορές, υπάρχουν τμήματα κειμένου που δεν θέλετε να μεταφραστούν. Για παράδειγμα, ετικέτες σε αρχεία markdown. Το DeepL προτείνει ότι σε τέτοιες περιπτώσεις, το τμήμα του κειμένου που πρέπει να αποκλειστεί να μετατραπεί σε ετικέτες XML, να μεταφραστεί, και στη συνέχεια να αποκατασταθεί μετά την ολοκλήρωση της μετάφρασης. Για να υποστηρίξετε αυτό, είναι δυνατόν να καθορίσετε τα τμήματα που πρέπει να μείνουν απόκρυφα από τη μετάφραση.

--xlate-setopt maskfile=MASKPATTERN

Αυτό θα ερμηνεύσει κάθε γραμμή του αρχείου `MASKPATTERN` ως έναν τακτικό εκφρασμένο, θα μεταφράσει τις συμβολοσειρές που ταιριάζουν με αυτό, και θα επαναφέρει μετά την επεξεργασία. Οι γραμμές που αρχίζουν με # αγνοούνται.

Ένα πολύπλοκο πρότυπο μπορεί να γραφτεί σε πολλαπλές γραμμές με αναδρομή με backslash.

Πώς η μετατροπή του κειμένου με τη χρήση μάσκας μπορεί να δει κανείς μέσω της επιλογής --xlate-mask.

Αυτή η διεπαφή είναι πειραματική και υπόκειται σε αλλαγές στο μέλλον.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

Καλέστε τη διαδικασία μετάφρασης για κάθε ταιριαστή περιοχή.

Χωρίς αυτήν την επιλογή, το greple συμπεριφέρεται ως ένα κανονικό πρόγραμμα αναζήτησης. Έτσι μπορείτε να ελέγξετε ποιο μέρος του αρχείου θα υπόκειται στη μετάφραση πριν καλέσετε την πραγματική εργασία.

Το αποτέλεσμα της εντολής πηγαίνει στην τυπική έξοδο, οπότε αν χρειάζεται ανακατεύθυνση σε αρχείο, ή σκεφτείτε να χρησιμοποιήσετε το πρόσθετο App::Greple::update.

Η επιλογή --xlate καλεί την επιλογή --xlate-color με την επιλογή --color=never.

Με την επιλογή --xlate-fold, το μεταφρασμένο κείμενο διπλώνεται με το καθορισμένο πλάτος. Το προεπιλεγμένο πλάτος είναι 70 και μπορεί να οριστεί με την επιλογή --xlate-fold-width. Τέσσερεις στήλες είναι καταλεγμένες για τη λειτουργία run-in, οπότε κάθε γραμμή μπορεί να περιέχει το πολύ 74 χαρακτήρες.

--xlate-engine=engine

Καθορίζει τη μηχανή μετάφρασης που θα χρησιμοποιηθεί. Εάν καθορίσετε απευθείας το μοντούλο της μηχανής, όπως -Mxlate::deepl, δεν χρειάζεται να χρησιμοποιήσετε αυτήν την επιλογή.

Προς το παρόν, διατίθενται οι ακόλουθες μηχανές:

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4-turbo

  • gpt4o: gpt-4o-mini

    Η διεπαφή του gpt-4o είναι ασταθής και δεν μπορεί να εγγυηθεί ότι λειτουργεί σωστά αυτή τη στιγμή.

--xlate-labor
--xlabor

Αντί να καλείτε τη μηχανή μετάφρασης, αναμένεται να εργαστείτε εσείς. Αφού προετοιμάσετε το κείμενο που πρόκειται να μεταφραστεί, αντιγράφετε το στο πρόχειρο. Αναμένεται να το επικολλήσετε στη φόρμα, να αντιγράψετε το αποτέλεσμα στο πρόχειρο και να πατήσετε Enter.

--xlate-to (Default: EN-US)

Καθορίστε τη γλώσσα προορισμού. Μπορείτε να λάβετε τις διαθέσιμες γλώσσες με την εντολή deepl languages όταν χρησιμοποιείτε τη μηχανή DeepL.

--xlate-format=format (Default: conflict)

Καθορίστε τη μορφή εξόδου για το αρχικό και μεταφρασμένο κείμενο.

Οι παρακάτω μορφές εκτός από το xtxt υποθέτουν ότι το τμήμα που πρέπει να μεταφραστεί είναι μια συλλογή γραμμών. Στην πραγματικότητα, είναι δυνατόν να μεταφράσετε μόνο ένα τμήμα μιας γραμμής, και η καθορισμένη μορφή εκτός από το xtxt δεν θα παράγει νόηματα.

conflict, cm

Ο αρχικός και μετατραπέντας κείμενος εκτυπώνονται σε μορφή δείκτη σύγκρουσης git(1).

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

Μπορείτε να ανακτήσετε το αρχικό αρχείο με την επόμενη εντολή sed(1).

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

```markdown

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

Αυτό σημαίνει:

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

Ο αριθμός των αίωνων είναι 7 από προεπιλογή. Εάν καθορίσετε μια ακολουθία αίωνων όπως :::::, χρησιμοποιείται αντί για τους 7 αίωνες.

ifdef

Ο αρχικός και μετατραπέντας κείμενος εκτυπώνονται σε μορφή cpp(1) #ifdef.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

Μπορείτε να ανακτήσετε μόνο το ιαπωνικό κείμενο με την εντολή unifdef:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

Original:

xtxt

Εάν η μορφή είναι xtxt (μεταφρασμένο κείμενο) ή άγνωστη, εκτυπώνεται μόνο το μεταφρασμένο κείμενο.

--xlate-maxlen=chars (Default: 0)

Μεταφράστε το παρακάτω κείμενο στα ελληνικά, γραμμή-προς-γραμμή.

--xlate-maxline=n (Default: 0)

Καθορίστε το μέγιστο αριθμό γραμμών κειμένου που θα σταλεί στο API ταυτόχρονα.

Ορίστε αυτήν την τιμή σε 1 αν θέλετε να μεταφράσετε μία γραμμή κάθε φορά. Αυτή η επιλογή έχει προτεραιότητα έναντι της επιλογής --xlate-maxlen.

--[no-]xlate-progress (Default: True)

Δείτε το αποτέλεσμα της μετάφρασης σε πραγματικό χρόνο στην έξοδο STDERR.

--xlate-stripe

Χρησιμοποιήστε το πρόσθετο App::Greple::stripe για να εμφανίσετε το ταιριασμένο τμήμα με τρόπο ζέβρα. Αυτό είναι χρήσιμο όταν τα ταιριασμένα τμήματα είναι συνδεδεμένα πίσω-μπροστά.

Η παλέτα χρωμάτων αλλάζει ανάλογα με το χρώμα του φόντου του τερματικού. Αν θέλετε να το καθορίσετε ρητά, μπορείτε να χρησιμοποιήσετε τις επιλογές --xlate-stripe-light ή --xlate-stripe-dark.

--xlate-mask

Εκτελέστε τη λειτουργία μάσκας και εμφανίστε το μετατραπέν κείμενο χωρίς ανάκτηση.

--match-all

Ορίστε ολόκληρο το κείμενο του αρχείου ως περιοχή στόχο.

CACHE OPTIONS

Το πρόσθετο xlate μπορεί να αποθηκεύει το μεταφρασμένο κείμενο για κάθε αρχείο και να το διαβάζει πριν από την εκτέλεση για να εξαλείψει τον χρόνο που απαιτείται για την επικοινωνία με τον διακομιστή. Με την προεπιλεγμένη στρατηγική προσωρινής αποθήκευσης auto, διατηρεί τα δεδομένα προσωρινής αποθήκευσης μόνο όταν το αρχείο προσωρινής αποθήκευσης υπάρχει για το συγκεκριμένο αρχείο στόχο.

Χρησιμοποιήστε το --xlate-cache=clear για να εκκινήσετε τη διαχείριση της μνήμης cache ή για να καθαρίσετε όλα τα υπάρχοντα δεδομένα cache. Μόλις εκτελεστεί με αυτήν την επιλογή, θα δημιουργηθεί ένα νέο αρχείο cache αν δεν υπάρχει και στη συνέχεια θα διατηρείται αυτόματα.

--xlate-cache=strategy
auto (Default)

Διατηρήστε το αρχείο προσωρινής αποθήκευσης αν υπάρχει.

create

Δημιουργήστε ένα κενό αρχείο προσωρινής αποθήκευσης και τερματίστε.

always, yes, 1

Διατηρήστε την προσωρινή μνήμη ούτως ή άλλως, όσο το προορισμένο αρχείο είναι κανονικό αρχείο.

clear

Καθαρίστε πρώτα τα δεδομένα της προσωρινής μνήμης.

never, no, 0

Ποτέ μην χρησιμοποιείτε το αρχείο της προσωρινής μνήμης, ακόμα κι αν υπάρχει.

accumulate

Από προεπιλογή, τα αχρησιμοποίητα δεδομένα αφαιρούνται από το αρχείο της προσωρινής μνήμης. Εάν δεν θέλετε να τα αφαιρέσετε και να τα κρατήσετε στο αρχείο, χρησιμοποιήστε την επιλογή accumulate.

--xlate-update

Αυτή η επιλογή εξαναγκάζει την ενημέρωση του αρχείου cache ακόμα και αν δεν είναι απαραίτητο.

COMMAND LINE INTERFACE

Μπορείτε εύκολα να χρησιμοποιήσετε αυτήν την ενότητα από τη γραμμή εντολών χρησιμοποιώντας την εντολή xlate που περιλαμβάνεται στη διανομή. Δείτε τις πληροφορίες βοήθειας της εντολής xlate για τη χρήση.

Η εντολή xlate λειτουργεί σε συνεργασία με το περιβάλλον Docker, οπότε ακόμα κι αν δεν έχετε κάτι εγκατεστημένο στο χέρι, μπορείτε να το χρησιμοποιήσετε όσον ο Docker είναι διαθέσιμος. Χρησιμοποιήστε την επιλογή -D ή -C.

Επίσης, εφόσον παρέχονται αρχεία makefiles για διάφορα στυλ εγγράφου, είναι δυνατή η μετάφραση σε άλλες γλώσσες χωρίς ειδική προδιαγραφή. Χρησιμοποιήστε την επιλογή -M.

Μπορείτε επίσης να συνδυάσετε τις επιλογές Docker και make έτσι ώστε να μπορείτε να εκτελέσετε την εντολή make σε ένα περιβάλλον Docker.

Η εκτέλεση όπως η xlate -GC θα εκκινήσει ένα κέλυφος με το τρέχον αποθετήριο git που έχει προσαρτηθεί.

Διαβάστε το ιαπωνικό άρθρο στην ενότητα "ΔΕΙΤΕ ΕΠΙΣΗΣ" για λεπτομέρειες.

xlate [ options ] -t lang file [ greple options ]
    -h   help
    -v   show version
    -d   debug
    -n   dry-run
    -a   use API
    -c   just check translation area
    -r   refresh cache
    -s   silent mode
    -e # translation engine (default "deepl")
    -p # pattern to determine translation area
    -w # wrap line by # width
    -o # output format (default "xtxt", or "cm", "ifdef")
    -f # from lang (ignored)
    -t # to lang (required, no default)
    -m # max length per API call
    -l # show library files (XLATE.mk, xlate.el)
    --   terminate option parsing
Make options
    -M   run make
    -n   dry-run
Docker options
    -G   mount git top-level directory
    -B   run in non-interactive (batch) mode
    -R   mount read-only
    -E * specify environment variable to be inherited
    -I * specify altanative docker image (default: tecolicom/xlate:version)
    -D * run xlate on the container with the rest parameters
    -C * run following command on the container, or run shell

Control Files:
    *.LANG    translation languates
    *.FORMAT  translation foramt (xtxt, cm, ifdef)
    *.ENGINE  translation engine (deepl or gpt3)

EMACS

Φορτώστε το αρχείο xlate.el που περιλαμβάνεται στο αποθετήριο για να χρησιμοποιήσετε την εντολή xlate από τον επεξεργαστή Emacs. Η συνάρτηση xlate-region μεταφράζει την δοθείσα περιοχή. Η προεπιλεγμένη γλώσσα είναι η EN-US και μπορείτε να καθορίσετε τη γλώσσα καλώντας την με πρόθεμα.

ENVIRONMENT

DEEPL_AUTH_KEY

Ορίστε το κλειδί πιστοποίησης σας για την υπηρεσία DeepL.

OPENAI_API_KEY

Κλειδί επαλήθευσης OpenAI.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

Πρέπει να εγκαταστήσετε τα εργαλεία γραμμής εντολών για το DeepL και το ChatGPT.

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

SEE ALSO

App::Greple::xlate

App::Greple::xlate::deepl

App::Greple::xlate::gpt3

  • https://hub.docker.com/r/tecolicom/xlate

    Εικόνα εμφιάλωσης Docker.

  • https://github.com/DeepLcom/deepl-python

    Βιβλιοθήκη DeepL Python και εντολή CLI.

  • https://github.com/openai/openai-python

    Βιβλιοθήκη Python της OpenAI

  • https://github.com/tecolicom/App-gpty

    Διεπαφή γραμμής εντολών της OpenAI

  • App::Greple

    Δείτε το εγχειρίδιο greple για λεπτομέρειες σχετικά με το πρότυπο κειμένου προορισμού. Χρησιμοποιήστε τις επιλογές --inside, --outside, --include, --exclude για να περιορίσετε την περιοχή της αντιστοίχισης.

  • App::Greple::update

    Μπορείτε να χρησιμοποιήσετε τον μονάδα -Mupdate για να τροποποιήσετε αρχεία με βάση το αποτέλεσμα της εντολής greple.

  • App::sdif

    Χρησιμοποιήστε το sdif για να εμφανίσετε τη μορφή του δείκτη σύγκρουσης δίπλα-δίπλα με την επιλογή -V.

  • App::Greple::stripe

    Χρήση του μοντέλου Greple stripe με την επιλογή --xlate-stripe.

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.