NAME
App::Greple::xlate - μονάδα υποστήριξης μετάφρασης για το greple
SYNOPSIS
greple -Mxlate::deepl --xlate pattern target-file
greple -Mxlate::gpt4 --xlate pattern target-file
greple -Mxlate --xlate-engine gpt4 --xlate pattern target-file
VERSION
Version 0.9912
DESCRIPTION
Greple xlate η μονάδα εντοπίζει τα επιθυμητά μπλοκ κειμένου και τα αντικαθιστά με το μεταφρασμένο κείμενο. Προς το παρόν, οι DeepL (deepl.pm) και ChatGPT 4.1 (gpt4.pm) έχουν υλοποιηθεί ως μηχανές back-end.
Αν θέλετε να μεταφράσετε κανονικά μπλοκ κειμένου σε ένα έγγραφο γραμμένο σε στυλ pod της Perl, χρησιμοποιήστε την εντολή greple με τις μονάδες xlate::deepl
και perl
ως εξής:
greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm
Σε αυτή την εντολή, η συμβολοσειρά μοτίβου ^([\w\pP].*\n)+
σημαίνει διαδοχικές γραμμές που ξεκινούν με αλφαριθμητικό ή σημείο στίξης. Αυτή η εντολή εμφανίζει την περιοχή που θα μεταφραστεί με επισήμανση. Η επιλογή --all χρησιμοποιείται για την παραγωγή ολόκληρου του κειμένου.
Στη συνέχεια, προσθέστε την επιλογή --xlate
για να μεταφράσετε την επιλεγμένη περιοχή. Έπειτα, θα βρει τα επιθυμητά τμήματα και θα τα αντικαταστήσει με την έξοδο της εντολής deepl.
Από προεπιλογή, το αρχικό και το μεταφρασμένο κείμενο εκτυπώνονται σε μορφή "conflict marker" συμβατή με το git(1). Χρησιμοποιώντας τη μορφή ifdef
, μπορείτε να πάρετε το επιθυμητό μέρος εύκολα με την εντολή unifdef(1). Η μορφή εξόδου μπορεί να καθοριστεί με την επιλογή --xlate-format.
Αν θέλετε να μεταφράσετε ολόκληρο το κείμενο, χρησιμοποιήστε την επιλογή --match-all. Αυτή είναι μια συντόμευση για να καθορίσετε το μοτίβο (?s).+
που ταιριάζει με ολόκληρο το κείμενο.
Τα δεδομένα μορφής δεικτών σύγκρουσης μπορούν να προβληθούν σε στυλ δίπλα-δίπλα με την εντολή sdif και την επιλογή -V
. Επειδή δεν έχει νόημα η σύγκριση ανά συμβολοσειρά, συνιστάται η επιλογή --no-cdif
. Αν δεν χρειάζεται να χρωματίσετε το κείμενο, ορίστε --no-textcolor
(ή --no-tc
).
sdif -V --no-filename --no-tc --no-cdif data_shishin.deepl-EN-US.cm
NORMALIZATION
Η επεξεργασία γίνεται σε καθορισμένες μονάδες, αλλά στην περίπτωση ακολουθίας πολλαπλών γραμμών μη κενών κειμένων, μετατρέπονται μαζί σε μία γραμμή. Αυτή η λειτουργία εκτελείται ως εξής:
Αφαιρέστε τα κενά στην αρχή και το τέλος κάθε γραμμής.
Αν μια γραμμή τελειώνει με χαρακτήρα στίξης πλήρους πλάτους, ενώστε με την επόμενη γραμμή.
Αν μια γραμμή τελειώνει με χαρακτήρα πλήρους πλάτους και η επόμενη γραμμή αρχίζει με χαρακτήρα πλήρους πλάτους, ενώστε τις γραμμές.
Αν είτε το τέλος είτε η αρχή μιας γραμμής δεν είναι χαρακτήρας πλήρους πλάτους, ενώστε τις εισάγοντας ένα κενό διάστημα.
Τα δεδομένα της προσωρινής μνήμης διαχειρίζονται με βάση το κανονικοποιημένο κείμενο, οπότε ακόμη και αν γίνουν τροποποιήσεις που δεν επηρεάζουν τα αποτελέσματα της κανονικοποίησης, τα αποθηκευμένα μεταφρασμένα δεδομένα θα παραμείνουν αποτελεσματικά.
Αυτή η διαδικασία κανονικοποίησης εκτελείται μόνο για το πρώτο (0ο) και τα ζυγά μοτίβα. Έτσι, αν καθοριστούν δύο μοτίβα ως εξής, το κείμενο που ταιριάζει με το πρώτο μοτίβο θα υποβληθεί σε επεξεργασία μετά την κανονικοποίηση, και δεν θα εκτελεστεί κανονικοποίηση στο κείμενο που ταιριάζει με το δεύτερο μοτίβο.
greple -Mxlate -E normalized -E not-normalized
Επομένως, χρησιμοποιήστε το πρώτο μοτίβο για κείμενο που θα υποβληθεί σε επεξεργασία συνδυάζοντας πολλές γραμμές σε μία, και το δεύτερο μοτίβο για προδιαμορφωμένο κείμενο. Αν δεν υπάρχει κείμενο που να ταιριάζει με το πρώτο μοτίβο, χρησιμοποιήστε ένα μοτίβο που δεν ταιριάζει με τίποτα, όπως το (?!)
.
MASKING
Περιστασιακά, υπάρχουν μέρη του κειμένου που δεν θέλετε να μεταφραστούν. Για παράδειγμα, ετικέτες σε αρχεία markdown. Η DeepL προτείνει σε τέτοιες περιπτώσεις το μέρος του κειμένου που θα εξαιρεθεί να μετατρέπεται σε ετικέτες XML, να μεταφράζεται και στη συνέχεια να επαναφέρεται μετά την ολοκλήρωση της μετάφρασης. Για να υποστηριχθεί αυτό, είναι δυνατό να καθοριστούν τα μέρη που θα αποκλειστούν από τη μετάφραση.
--xlate-setopt maskfile=MASKPATTERN
Αυτό θα ερμηνεύσει κάθε γραμμή του αρχείου `MASKPATTERN` ως κανονική έκφραση, θα μεταφράσει τις συμβολοσειρές που ταιριάζουν και θα τις επαναφέρει μετά την επεξεργασία. Οι γραμμές που ξεκινούν με #
αγνοούνται.
Σύνθετα μοτίβα μπορούν να γραφτούν σε πολλές γραμμές με διαφυγή της αλλαγής γραμμής με backslash.
Το πώς μετασχηματίζεται το κείμενο με τη μάσκα μπορεί να φανεί με την επιλογή --xlate-mask.
Αυτή η διεπαφή είναι πειραματική και ενδέχεται να αλλάξει στο μέλλον.
OPTIONS
- --xlate
- --xlate-color
- --xlate-fold
- --xlate-fold-width=n (Default: 70)
-
Εκκινήστε τη διαδικασία μετάφρασης για κάθε ταιριαστή περιοχή.
Χωρίς αυτήν την επιλογή, το greple λειτουργεί ως κανονική εντολή αναζήτησης. Έτσι μπορείτε να ελέγξετε ποιο μέρος του αρχείου θα αποτελέσει αντικείμενο μετάφρασης πριν ξεκινήσετε την πραγματική εργασία.
Το αποτέλεσμα της εντολής πηγαίνει στην τυπική έξοδο, οπότε ανακατευθύνετε σε αρχείο αν χρειάζεται ή σκεφτείτε να χρησιμοποιήσετε το App::Greple::update module.
Η επιλογή --xlate καλεί την επιλογή --xlate-color με την επιλογή --color=never.
Με την επιλογή --xlate-fold, το μετατρεπόμενο κείμενο διπλώνεται στο καθορισμένο πλάτος. Το προεπιλεγμένο πλάτος είναι 70 και μπορεί να οριστεί με την επιλογή --xlate-fold-width. Τέσσερις στήλες κρατούνται για λειτουργία run-in, οπότε κάθε γραμμή μπορεί να έχει το πολύ 74 χαρακτήρες.
- --xlate-engine=engine
-
Καθορίζει τη μηχανή μετάφρασης που θα χρησιμοποιηθεί. Αν καθορίσετε απευθείας το module της μηχανής, όπως το
-Mxlate::deepl
, δεν χρειάζεται να χρησιμοποιήσετε αυτήν την επιλογή.Αυτή τη στιγμή, οι παρακάτω μηχανές είναι διαθέσιμες
deepl: DeepL API
gpt3: gpt-3.5-turbo
gpt4: gpt-4.1
gpt4o: gpt-4o-mini
gpt-4o's interface είναι ασταθές και δεν μπορεί να εγγυηθεί ότι θα λειτουργεί σωστά αυτή τη στιγμή.
- --xlate-labor
- --xlabor
-
Αντί να καλείτε τη μηχανή μετάφρασης, αναμένεται να εργαστείτε εσείς. Αφού προετοιμάσετε το κείμενο προς μετάφραση, αντιγράφεται στο πρόχειρο. Αναμένεται να το επικολλήσετε στη φόρμα, να αντιγράψετε το αποτέλεσμα στο πρόχειρο και να πατήσετε return.
- --xlate-to (Default:
EN-US
) -
Καθορίστε τη γλώσσα-στόχο. Μπορείτε να λάβετε τις διαθέσιμες γλώσσες με την εντολή
deepl languages
όταν χρησιμοποιείτε τη μηχανή DeepL. - --xlate-format=format (Default:
conflict
) -
Καθορίστε τη μορφή εξόδου για το αρχικό και το μεταφρασμένο κείμενο.
Οι παρακάτω μορφές εκτός από το
xtxt
υποθέτουν ότι το μέρος που θα μεταφραστεί είναι μια συλλογή γραμμών. Στην πραγματικότητα, είναι δυνατό να μεταφραστεί μόνο ένα μέρος μιας γραμμής, αλλά αν ορίσετε μορφή εκτός από τοxtxt
δεν θα παραχθούν ουσιαστικά αποτελέσματα.- conflict, cm
-
Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή conflict marker git(1).
<<<<<<< ORIGINAL original text ======= translated Japanese text >>>>>>> JA
Μπορείτε να ανακτήσετε το αρχικό αρχείο με την επόμενη εντολή sed(1).
sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
- colon, :::::::
-
Το αρχικό και το μεταφρασμένο κείμενο εξάγονται σε προσαρμοσμένο container markdown.
::::::: ORIGINAL original text ::::::: ::::::: JA translated Japanese text :::::::
Το παραπάνω κείμενο θα μεταφραστεί ως εξής σε HTML.
<div class="ORIGINAL"> original text </div> <div class="JA"> translated Japanese text </div>
Ο αριθμός των άνω κάτω τελειών είναι 7 από προεπιλογή. Αν καθορίσετε ακολουθία άνω κάτω τελειών όπως το
:::::
, αυτή χρησιμοποιείται αντί για 7 άνω κάτω τελείες. - ifdef
-
Το αρχικό και το μετατρεπόμενο κείμενο εκτυπώνονται σε μορφή cpp(1)
#ifdef
.#ifdef ORIGINAL original text #endif #ifdef JA translated Japanese text #endif
Μπορείτε να ανακτήσετε μόνο το ιαπωνικό κείμενο με την εντολή unifdef:
unifdef -UORIGINAL -DJA foo.ja.pm
- space
- space+
-
Το αρχικό και το μετατραπέν κείμενο εκτυπώνονται χωριστά με μία κενή γραμμή.
- xtxt
-
Για το
space+
, εκτυπώνεται επίσης μια νέα γραμμή μετά το μετατραπέν κείμενο.
- --xlate-maxlen=chars (Default: 0)
-
Αν η μορφή είναι
xtxt
(μεταφρασμένο κείμενο) ή άγνωστη, εκτυπώνεται μόνο το μεταφρασμένο κείμενο. - --xlate-maxline=n (Default: 0)
-
Καθορίστε το μέγιστο μήκος κειμένου που θα αποστέλλεται στο API κάθε φορά. Η προεπιλεγμένη τιμή έχει οριστεί όπως για τη δωρεάν υπηρεσία λογαριασμού DeepL: 128K για το API (--xlate) και 5000 για τη διεπαφή πρόχειρου (--xlate-labor). Μπορείτε να αλλάξετε αυτές τις τιμές αν χρησιμοποιείτε την υπηρεσία Pro.
Καθορίστε το μέγιστο αριθμό γραμμών κειμένου που θα αποστέλλονται στο API κάθε φορά.
- --[no-]xlate-progress (Default: True)
-
Ορίστε αυτήν την τιμή σε 1 αν θέλετε να μεταφράζετε μία γραμμή κάθε φορά. Αυτή η επιλογή υπερισχύει της επιλογής
--xlate-maxlen
. - --xlate-stripe
-
Δείτε το αποτέλεσμα της μετάφρασης σε πραγματικό χρόνο στην έξοδο STDERR.
Χρησιμοποιήστε το App::Greple::stripe για να εμφανίσετε το ταιριασμένο μέρος με εναλλασσόμενες ρίγες τύπου ζέβρας. Αυτό είναι χρήσιμο όταν τα ταιριασμένα μέρη συνδέονται διαδοχικά.
- --xlate-mask
-
Η παλέτα χρωμάτων αλλάζει ανάλογα με το χρώμα φόντου του τερματικού. Αν θέλετε να το ορίσετε ρητά, μπορείτε να χρησιμοποιήσετε το --xlate-stripe-light ή το --xlate-stripe-dark.
- --match-all
-
Εκτελέστε τη λειτουργία μάσκας και εμφανίστε το μετατραπέν κείμενο ως έχει χωρίς αποκατάσταση.
- --lineify-cm
- --lineify-colon
-
Στην περίπτωση των μορφών
cm
καιcolon
, η έξοδος χωρίζεται και μορφοποιείται γραμμή προς γραμμή.Επομένως, αν μόνο ένα μέρος μιας γραμμής μεταφραστεί, δεν μπορεί να ληφθεί το αναμενόμενο αποτέλεσμα.
CACHE OPTIONS
Ορίστε ολόκληρο το κείμενο του αρχείου ως περιοχή στόχου.
Το xlate μπορεί να αποθηκεύσει προσωρινά το μεταφρασμένο κείμενο για κάθε αρχείο και να το διαβάσει πριν την εκτέλεση ώστε να εξαλειφθεί το κόστος επικοινωνίας με τον διακομιστή. Με τη στρατηγική προσωρινής αποθήκευσης auto
ως προεπιλογή, διατηρεί τα δεδομένα cache μόνο όταν υπάρχει αρχείο cache για το αρχείο στόχο.
- --xlate-cache=strategy
-
auto
(Default)-
Χρησιμοποιήστε το --xlate-cache=clear για να ξεκινήσετε τη διαχείριση cache ή να καθαρίσετε όλα τα υπάρχοντα δεδομένα cache. Μόλις εκτελεστεί με αυτήν την επιλογή, θα δημιουργηθεί νέο αρχείο cache αν δεν υπάρχει και στη συνέχεια θα διατηρείται αυτόματα.
create
-
Διατηρήστε το αρχείο cache αν υπάρχει.
always
,yes
,1
-
Δημιουργήστε κενό αρχείο cache και τερματίστε.
clear
-
Διατηρήστε το cache ούτως ή άλλως εφόσον ο στόχος είναι κανονικό αρχείο.
never
,no
,0
-
Καθαρίστε πρώτα τα δεδομένα cache.
accumulate
-
Μην χρησιμοποιείτε ποτέ αρχείο cache ακόμα κι αν υπάρχει.
- --xlate-update
-
Από προεπιλογή, τα αχρησιμοποίητα δεδομένα αφαιρούνται από το αρχείο cache. Αν δεν θέλετε να τα αφαιρέσετε και να τα διατηρήσετε στο αρχείο, χρησιμοποιήστε το
accumulate
.
COMMAND LINE INTERFACE
Αυτή η επιλογή αναγκάζει την ενημέρωση του αρχείου cache ακόμα κι αν δεν είναι απαραίτητο.
Μπορείτε εύκολα να χρησιμοποιήσετε αυτήν τη μονάδα από τη γραμμή εντολών χρησιμοποιώντας την εντολή xlate
που περιλαμβάνεται στη διανομή. Δείτε τη σελίδα man xlate
για οδηγίες χρήσης.
Η εντολή xlate
λειτουργεί σε συνδυασμό με το περιβάλλον Docker, οπότε ακόμα κι αν δεν έχετε τίποτα εγκατεστημένο τοπικά, μπορείτε να το χρησιμοποιήσετε αρκεί να είναι διαθέσιμο το Docker. Χρησιμοποιήστε την επιλογή -D
ή -C
.
Επίσης, επειδή παρέχονται makefiles για διάφορα στυλ εγγράφων, είναι δυνατή η μετάφραση σε άλλες γλώσσες χωρίς ειδικό ορισμό. Χρησιμοποιήστε την επιλογή -M
.
Μπορείτε επίσης να συνδυάσετε τις επιλογές Docker και make
ώστε να μπορείτε να εκτελέσετε το make
σε περιβάλλον Docker.
Η εκτέλεση όπως xlate -C
θα εκκινήσει ένα shell με το τρέχον git repository προσαρτημένο.
EMACS
Φορτώστε το αρχείο xlate.el που περιλαμβάνεται στο αποθετήριο για να χρησιμοποιήσετε την εντολή xlate
από τον επεξεργαστή Emacs.
ENVIRONMENT
- DEEPL_AUTH_KEY
-
Η συνάρτηση
xlate-region
μεταφράζει την επιλεγμένη περιοχή. - OPENAI_API_KEY
-
Η προεπιλεγμένη γλώσσα είναι
EN-US
και μπορείτε να ορίσετε γλώσσα καλώντας τη με προθεματικό όρισμα.
INSTALL
CPANMINUS
$ cpanm App::Greple::xlate
TOOLS
Ορίστε το κλειδί ταυτοποίησης για την υπηρεσία DeepL.
Κλειδί ταυτοποίησης OpenAI.
Πρέπει να εγκαταστήσετε εργαλεία γραμμής εντολών για το DeepL και το ChatGPT.
SEE ALSO
https://github.com/DeepLcom/deepl-python
https://github.com/tecolicom/App-gpty
https://github.com/openai/openai-python
Εικόνα κοντέινερ Docker.
https://github.com/tecolicom/App-gpty
Βιβλιοθήκη Python DeepL και εντολή CLI.
-
Βιβλιοθήκη Python OpenAI
-
Διεπαφή γραμμής εντολών OpenAI
-
Δείτε το εγχειρίδιο greple για λεπτομέρειες σχετικά με το μοτίβο του κειμένου στόχου. Χρησιμοποιήστε τις επιλογές --inside, --outside, --include, --exclude για να περιορίσετε την περιοχή αντιστοίχισης.
-
Μπορείτε να χρησιμοποιήσετε το module
-Mupdate
για να τροποποιήσετε αρχεία με το αποτέλεσμα της εντολής greple.
ARTICLES
https://qiita.com/kaz-utashiro/items/1c1a51a4591922e18250
Χρησιμοποιήστε το sdif για να εμφανίσετε τη μορφή δείκτη σύγκρουσης δίπλα-δίπλα με την επιλογή -V.
https://qiita.com/kaz-utashiro/items/a5e19736416ca183ecf6
Το module Greple stripe χρησιμοποιείται με την επιλογή --xlate-stripe.
https://qiita.com/kaz-utashiro/items/1b9e155d6ae0620ab4dd
Module Greple για μετάφραση και αντικατάσταση μόνο των απαραίτητων τμημάτων με το DeepL API (στα Ιαπωνικά)
AUTHOR
Kazumasa Utashiro
LICENSE
Copyright © 2023-2025 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.