NAME

App::Greple::xlate - μονάδα υποστήριξης μετάφρασης για το greple

SYNOPSIS

greple -Mxlate::deepl --xlate pattern target-file

greple -Mxlate::gpt4 --xlate pattern target-file

greple -Mxlate --xlate-engine gpt4 --xlate pattern target-file

VERSION

Version 0.9912

DESCRIPTION

Greple xlate η μονάδα εντοπίζει τα επιθυμητά μπλοκ κειμένου και τα αντικαθιστά με το μεταφρασμένο κείμενο. Προς το παρόν, οι DeepL (deepl.pm) και ChatGPT 4.1 (gpt4.pm) έχουν υλοποιηθεί ως μηχανές back-end.

Αν θέλετε να μεταφράσετε κανονικά μπλοκ κειμένου σε ένα έγγραφο γραμμένο σε στυλ pod της Perl, χρησιμοποιήστε την εντολή greple με τις μονάδες xlate::deepl και perl ως εξής:

greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm

Σε αυτή την εντολή, η συμβολοσειρά μοτίβου ^([\w\pP].*\n)+ σημαίνει διαδοχικές γραμμές που ξεκινούν με αλφαριθμητικό ή σημείο στίξης. Αυτή η εντολή εμφανίζει την περιοχή που θα μεταφραστεί με επισήμανση. Η επιλογή --all χρησιμοποιείται για την παραγωγή ολόκληρου του κειμένου.

Στη συνέχεια, προσθέστε την επιλογή --xlate για να μεταφράσετε την επιλεγμένη περιοχή. Έπειτα, θα βρει τα επιθυμητά τμήματα και θα τα αντικαταστήσει με την έξοδο της εντολής deepl.

Από προεπιλογή, το αρχικό και το μεταφρασμένο κείμενο εκτυπώνονται σε μορφή "conflict marker" συμβατή με το git(1). Χρησιμοποιώντας τη μορφή ifdef, μπορείτε να πάρετε το επιθυμητό μέρος εύκολα με την εντολή unifdef(1). Η μορφή εξόδου μπορεί να καθοριστεί με την επιλογή --xlate-format.

Αν θέλετε να μεταφράσετε ολόκληρο το κείμενο, χρησιμοποιήστε την επιλογή --match-all. Αυτή είναι μια συντόμευση για να καθορίσετε το μοτίβο (?s).+ που ταιριάζει με ολόκληρο το κείμενο.

Τα δεδομένα μορφής δεικτών σύγκρουσης μπορούν να προβληθούν σε στυλ δίπλα-δίπλα με την εντολή sdif και την επιλογή -V. Επειδή δεν έχει νόημα η σύγκριση ανά συμβολοσειρά, συνιστάται η επιλογή --no-cdif. Αν δεν χρειάζεται να χρωματίσετε το κείμενο, ορίστε --no-textcolor--no-tc).

sdif -V --no-filename --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

Η επεξεργασία γίνεται σε καθορισμένες μονάδες, αλλά στην περίπτωση ακολουθίας πολλαπλών γραμμών μη κενών κειμένων, μετατρέπονται μαζί σε μία γραμμή. Αυτή η λειτουργία εκτελείται ως εξής:

  • Αφαιρέστε τα κενά στην αρχή και το τέλος κάθε γραμμής.

  • Αν μια γραμμή τελειώνει με χαρακτήρα στίξης πλήρους πλάτους, ενώστε με την επόμενη γραμμή.

  • Αν μια γραμμή τελειώνει με χαρακτήρα πλήρους πλάτους και η επόμενη γραμμή αρχίζει με χαρακτήρα πλήρους πλάτους, ενώστε τις γραμμές.

  • Αν είτε το τέλος είτε η αρχή μιας γραμμής δεν είναι χαρακτήρας πλήρους πλάτους, ενώστε τις εισάγοντας ένα κενό διάστημα.

Τα δεδομένα της προσωρινής μνήμης διαχειρίζονται με βάση το κανονικοποιημένο κείμενο, οπότε ακόμη και αν γίνουν τροποποιήσεις που δεν επηρεάζουν τα αποτελέσματα της κανονικοποίησης, τα αποθηκευμένα μεταφρασμένα δεδομένα θα παραμείνουν αποτελεσματικά.

Αυτή η διαδικασία κανονικοποίησης εκτελείται μόνο για το πρώτο (0ο) και τα ζυγά μοτίβα. Έτσι, αν καθοριστούν δύο μοτίβα ως εξής, το κείμενο που ταιριάζει με το πρώτο μοτίβο θα υποβληθεί σε επεξεργασία μετά την κανονικοποίηση, και δεν θα εκτελεστεί κανονικοποίηση στο κείμενο που ταιριάζει με το δεύτερο μοτίβο.

greple -Mxlate -E normalized -E not-normalized

Επομένως, χρησιμοποιήστε το πρώτο μοτίβο για κείμενο που θα υποβληθεί σε επεξεργασία συνδυάζοντας πολλές γραμμές σε μία, και το δεύτερο μοτίβο για προδιαμορφωμένο κείμενο. Αν δεν υπάρχει κείμενο που να ταιριάζει με το πρώτο μοτίβο, χρησιμοποιήστε ένα μοτίβο που δεν ταιριάζει με τίποτα, όπως το (?!).

MASKING

Περιστασιακά, υπάρχουν μέρη του κειμένου που δεν θέλετε να μεταφραστούν. Για παράδειγμα, ετικέτες σε αρχεία markdown. Η DeepL προτείνει σε τέτοιες περιπτώσεις το μέρος του κειμένου που θα εξαιρεθεί να μετατρέπεται σε ετικέτες XML, να μεταφράζεται και στη συνέχεια να επαναφέρεται μετά την ολοκλήρωση της μετάφρασης. Για να υποστηριχθεί αυτό, είναι δυνατό να καθοριστούν τα μέρη που θα αποκλειστούν από τη μετάφραση.

--xlate-setopt maskfile=MASKPATTERN

Αυτό θα ερμηνεύσει κάθε γραμμή του αρχείου `MASKPATTERN` ως κανονική έκφραση, θα μεταφράσει τις συμβολοσειρές που ταιριάζουν και θα τις επαναφέρει μετά την επεξεργασία. Οι γραμμές που ξεκινούν με # αγνοούνται.

Σύνθετα μοτίβα μπορούν να γραφτούν σε πολλές γραμμές με διαφυγή της αλλαγής γραμμής με backslash.

Το πώς μετασχηματίζεται το κείμενο με τη μάσκα μπορεί να φανεί με την επιλογή --xlate-mask.

Αυτή η διεπαφή είναι πειραματική και ενδέχεται να αλλάξει στο μέλλον.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

Εκκινήστε τη διαδικασία μετάφρασης για κάθε ταιριαστή περιοχή.

Χωρίς αυτήν την επιλογή, το greple λειτουργεί ως κανονική εντολή αναζήτησης. Έτσι μπορείτε να ελέγξετε ποιο μέρος του αρχείου θα αποτελέσει αντικείμενο μετάφρασης πριν ξεκινήσετε την πραγματική εργασία.

Το αποτέλεσμα της εντολής πηγαίνει στην τυπική έξοδο, οπότε ανακατευθύνετε σε αρχείο αν χρειάζεται ή σκεφτείτε να χρησιμοποιήσετε το App::Greple::update module.

Η επιλογή --xlate καλεί την επιλογή --xlate-color με την επιλογή --color=never.

Με την επιλογή --xlate-fold, το μετατρεπόμενο κείμενο διπλώνεται στο καθορισμένο πλάτος. Το προεπιλεγμένο πλάτος είναι 70 και μπορεί να οριστεί με την επιλογή --xlate-fold-width. Τέσσερις στήλες κρατούνται για λειτουργία run-in, οπότε κάθε γραμμή μπορεί να έχει το πολύ 74 χαρακτήρες.

--xlate-engine=engine

Καθορίζει τη μηχανή μετάφρασης που θα χρησιμοποιηθεί. Αν καθορίσετε απευθείας το module της μηχανής, όπως το -Mxlate::deepl, δεν χρειάζεται να χρησιμοποιήσετε αυτήν την επιλογή.

Αυτή τη στιγμή, οι παρακάτω μηχανές είναι διαθέσιμες

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4.1

  • gpt4o: gpt-4o-mini

    gpt-4o's interface είναι ασταθές και δεν μπορεί να εγγυηθεί ότι θα λειτουργεί σωστά αυτή τη στιγμή.

--xlate-labor
--xlabor

Αντί να καλείτε τη μηχανή μετάφρασης, αναμένεται να εργαστείτε εσείς. Αφού προετοιμάσετε το κείμενο προς μετάφραση, αντιγράφεται στο πρόχειρο. Αναμένεται να το επικολλήσετε στη φόρμα, να αντιγράψετε το αποτέλεσμα στο πρόχειρο και να πατήσετε return.

--xlate-to (Default: EN-US)

Καθορίστε τη γλώσσα-στόχο. Μπορείτε να λάβετε τις διαθέσιμες γλώσσες με την εντολή deepl languages όταν χρησιμοποιείτε τη μηχανή DeepL.

--xlate-format=format (Default: conflict)

Καθορίστε τη μορφή εξόδου για το αρχικό και το μεταφρασμένο κείμενο.

Οι παρακάτω μορφές εκτός από το xtxt υποθέτουν ότι το μέρος που θα μεταφραστεί είναι μια συλλογή γραμμών. Στην πραγματικότητα, είναι δυνατό να μεταφραστεί μόνο ένα μέρος μιας γραμμής, αλλά αν ορίσετε μορφή εκτός από το xtxt δεν θα παραχθούν ουσιαστικά αποτελέσματα.

conflict, cm

Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή conflict marker git(1).

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

Μπορείτε να ανακτήσετε το αρχικό αρχείο με την επόμενη εντολή sed(1).

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

Το αρχικό και το μεταφρασμένο κείμενο εξάγονται σε προσαρμοσμένο container markdown.

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

Το παραπάνω κείμενο θα μεταφραστεί ως εξής σε HTML.

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

Ο αριθμός των άνω κάτω τελειών είναι 7 από προεπιλογή. Αν καθορίσετε ακολουθία άνω κάτω τελειών όπως το :::::, αυτή χρησιμοποιείται αντί για 7 άνω κάτω τελείες.

ifdef

Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή cpp(1) #ifdef.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

Μπορείτε να ανακτήσετε μόνο το ιαπωνικό κείμενο με την εντολή unifdef:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

Το αρχικό και το μετατραπέν κείμενο εκτυπώνονται χωριστά με μία κενή γραμμή.

xtxt

Για το space+, εκτυπώνεται επίσης μια νέα γραμμή μετά το μετατραπέν κείμενο.

--xlate-maxlen=chars (Default: 0)

Αν η μορφή είναι xtxt (μεταφρασμένο κείμενο) ή άγνωστη, εκτυπώνεται μόνο το μεταφρασμένο κείμενο.

--xlate-maxline=n (Default: 0)

Καθορίστε το μέγιστο μήκος κειμένου που θα αποστέλλεται στο API κάθε φορά. Η προεπιλεγμένη τιμή έχει οριστεί όπως για τη δωρεάν υπηρεσία λογαριασμού DeepL: 128K για το API (--xlate) και 5000 για τη διεπαφή πρόχειρου (--xlate-labor). Μπορείτε να αλλάξετε αυτές τις τιμές αν χρησιμοποιείτε την υπηρεσία Pro.

Καθορίστε το μέγιστο αριθμό γραμμών κειμένου που θα αποστέλλονται στο API κάθε φορά.

--[no-]xlate-progress (Default: True)

Ορίστε αυτήν την τιμή σε 1 αν θέλετε να μεταφράζετε μία γραμμή κάθε φορά. Αυτή η επιλογή υπερισχύει της επιλογής --xlate-maxlen.

--xlate-stripe

Δείτε το αποτέλεσμα της μετάφρασης σε πραγματικό χρόνο στην έξοδο STDERR.

Χρησιμοποιήστε το App::Greple::stripe για να εμφανίσετε το ταιριασμένο μέρος με εναλλασσόμενες ρίγες τύπου ζέβρας. Αυτό είναι χρήσιμο όταν τα ταιριασμένα μέρη συνδέονται διαδοχικά.

--xlate-mask

Η παλέτα χρωμάτων αλλάζει ανάλογα με το χρώμα φόντου του τερματικού. Αν θέλετε να το ορίσετε ρητά, μπορείτε να χρησιμοποιήσετε το --xlate-stripe-light ή το --xlate-stripe-dark.

--match-all

Εκτελέστε τη λειτουργία μάσκας και εμφανίστε το μετατραπέν κείμενο ως έχει χωρίς αποκατάσταση.

--lineify-cm
--lineify-colon

Στην περίπτωση των μορφών cm και colon, η έξοδος χωρίζεται και μορφοποιείται γραμμή προς γραμμή.

Επομένως, αν μόνο ένα μέρος μιας γραμμής μεταφραστεί, δεν μπορεί να ληφθεί το αναμενόμενο αποτέλεσμα.

CACHE OPTIONS

Ορίστε ολόκληρο το κείμενο του αρχείου ως περιοχή στόχου.

Το xlate μπορεί να αποθηκεύσει προσωρινά το μεταφρασμένο κείμενο για κάθε αρχείο και να το διαβάσει πριν την εκτέλεση ώστε να εξαλειφθεί το κόστος επικοινωνίας με τον διακομιστή. Με τη στρατηγική προσωρινής αποθήκευσης auto ως προεπιλογή, διατηρεί τα δεδομένα cache μόνο όταν υπάρχει αρχείο cache για το αρχείο στόχο.

--xlate-cache=strategy
auto (Default)

Χρησιμοποιήστε το --xlate-cache=clear για να ξεκινήσετε τη διαχείριση cache ή να καθαρίσετε όλα τα υπάρχοντα δεδομένα cache. Μόλις εκτελεστεί με αυτήν την επιλογή, θα δημιουργηθεί νέο αρχείο cache αν δεν υπάρχει και στη συνέχεια θα διατηρείται αυτόματα.

create

Διατηρήστε το αρχείο cache αν υπάρχει.

always, yes, 1

Δημιουργήστε κενό αρχείο cache και τερματίστε.

clear

Διατηρήστε το cache ούτως ή άλλως εφόσον ο στόχος είναι κανονικό αρχείο.

never, no, 0

Καθαρίστε πρώτα τα δεδομένα cache.

accumulate

Μην χρησιμοποιείτε ποτέ αρχείο cache ακόμα κι αν υπάρχει.

--xlate-update

Από προεπιλογή, τα αχρησιμοποίητα δεδομένα αφαιρούνται από το αρχείο cache. Αν δεν θέλετε να τα αφαιρέσετε και να τα διατηρήσετε στο αρχείο, χρησιμοποιήστε το accumulate.

COMMAND LINE INTERFACE

Αυτή η επιλογή αναγκάζει την ενημέρωση του αρχείου cache ακόμα κι αν δεν είναι απαραίτητο.

Μπορείτε εύκολα να χρησιμοποιήσετε αυτήν τη μονάδα από τη γραμμή εντολών χρησιμοποιώντας την εντολή xlate που περιλαμβάνεται στη διανομή. Δείτε τη σελίδα man xlate για οδηγίες χρήσης.

Η εντολή xlate λειτουργεί σε συνδυασμό με το περιβάλλον Docker, οπότε ακόμα κι αν δεν έχετε τίποτα εγκατεστημένο τοπικά, μπορείτε να το χρησιμοποιήσετε αρκεί να είναι διαθέσιμο το Docker. Χρησιμοποιήστε την επιλογή -D ή -C.

Επίσης, επειδή παρέχονται makefiles για διάφορα στυλ εγγράφων, είναι δυνατή η μετάφραση σε άλλες γλώσσες χωρίς ειδικό ορισμό. Χρησιμοποιήστε την επιλογή -M.

Μπορείτε επίσης να συνδυάσετε τις επιλογές Docker και make ώστε να μπορείτε να εκτελέσετε το make σε περιβάλλον Docker.

Η εκτέλεση όπως xlate -C θα εκκινήσει ένα shell με το τρέχον git repository προσαρτημένο.

EMACS

Φορτώστε το αρχείο xlate.el που περιλαμβάνεται στο αποθετήριο για να χρησιμοποιήσετε την εντολή xlate από τον επεξεργαστή Emacs.

ENVIRONMENT

DEEPL_AUTH_KEY

Η συνάρτηση xlate-region μεταφράζει την επιλεγμένη περιοχή.

OPENAI_API_KEY

Η προεπιλεγμένη γλώσσα είναι EN-US και μπορείτε να ορίσετε γλώσσα καλώντας τη με προθεματικό όρισμα.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

Ορίστε το κλειδί ταυτοποίησης για την υπηρεσία DeepL.

Κλειδί ταυτοποίησης OpenAI.

Πρέπει να εγκαταστήσετε εργαλεία γραμμής εντολών για το DeepL και το ChatGPT.

SEE ALSO

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

App::Greple::xlate::gpt4

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2025 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.