NAME

App::Greple::xlate - Greple용 번역 지원 모듈

SYNOPSIS

greple -Mxlate -e ENGINE --xlate pattern target-file

greple -Mxlate::deepl --xlate pattern target-file

VERSION

Version 0.99

DESCRIPTION

그림 엑스레이트 모듈은 원하는 텍스트 블록을 찾아 번역된 텍스트로 대체합니다. 현재 DeepL (deepl.pm) 및 ChatGPT (gpt3.pm) 모듈이 백엔드 엔진으로 구현되어 있습니다. gpt-4 및 gpt-4o에 대한 실험적 지원도 포함되어 있습니다.

Perl의 포드 스타일로 작성된 문서에서 일반 텍스트 블록을 번역하려면 다음과 같이 greple 명령과 xlate::deeplperl 모듈을 사용합니다:

greple -Mxlate::deepl -Mperl --pod --re '^([\w\pP].*\n)+' --all foo.pm

이 명령에서 패턴 문자열 ^([\w\pP].*\n)+은 영숫자 및 구두점으로 시작하는 연속된 줄을 의미합니다. 이 명령은 번역할 영역을 강조 표시합니다. 옵션 --all은 전체 텍스트를 생성하는 데 사용됩니다.

그런 다음 --엑스레이트 옵션을 추가하여 선택한 영역을 번역합니다. 그런 다음 원하는 섹션을 찾아 명령 출력으로 대체합니다.

기본적으로 원본 및 번역된 텍스트는 git(1)과 호환되는 "충돌 마커" 형식으로 인쇄됩니다. ifdef 형식을 사용하면 unifdef(1) 명령으로 원하는 부분을 쉽게 얻을 수 있습니다. 출력 형식은 --xlate-format 옵션으로 지정할 수 있습니다.

전체 텍스트를 번역하려면 --match-all 옵션을 사용합니다. 이는 전체 텍스트와 일치하는 (?s).+ 패턴을 지정하는 단축키입니다.

충돌 마커 형식 데이터는 sdif 명령과 -V 옵션을 사용하여 나란히 정렬된 스타일로 볼 수 있습니다. 문자열 단위로 비교하는 것은 의미가 없으므로 --no-cdif 옵션을 사용하는 것이 좋습니다. 텍스트에 색상을 지정할 필요가 없는 경우 --no-textcolor(또는 --no-tc)를 지정합니다.

sdif -V --no-tc --no-cdif data_shishin.deepl-EN-US.cm

NORMALIZATION

처리는 지정된 단위로 수행되지만 비어 있지 않은 여러 줄의 텍스트 시퀀스의 경우 한 줄로 함께 변환됩니다. 이 작업은 다음과 같이 수행됩니다:

  • 각 줄의 시작과 끝에서 공백을 제거합니다.

  • 한 줄이 전폭 구두점 문자로 끝나면 다음 줄로 연결합니다.

  • 한 줄이 전폭 문자로 끝나고 다음 줄이 전폭 문자로 시작되는 경우 두 줄을 연결합니다.

  • 한 줄의 끝이나 시작이 전폭 문자가 아닌 경우 공백 문자를 삽입하여 연결합니다.

캐시 데이터는 정규화된 텍스트를 기반으로 관리되므로 정규화 결과에 영향을 미치지 않는 수정이 이루어지더라도 캐시된 번역 데이터는 여전히 유효합니다.

이 정규화 프로세스는 첫 번째(0번째) 및 짝수 패턴에 대해서만 수행됩니다. 따라서 다음과 같이 두 개의 패턴을 지정하면 첫 번째 패턴과 일치하는 텍스트는 정규화 후 처리되고 두 번째 패턴과 일치하는 텍스트에는 정규화 프로세스가 수행되지 않습니다.

greple -Mxlate -E normalized -E not-normalized

따라서 여러 줄을 한 줄로 결합하여 처리할 텍스트에는 첫 번째 패턴을 사용하고, 미리 서식이 지정된 텍스트에는 두 번째 패턴을 사용합니다. 첫 번째 패턴에 일치할 텍스트가 없는 경우 (?!)과 같이 아무것도 일치하지 않는 패턴을 사용합니다.

MASKING

간혹 번역하고 싶지 않은 텍스트 부분이 있을 수 있습니다. 예를 들어 마크다운 파일의 태그가 있습니다. DeepL 에서는 이러한 경우 제외할 텍스트 부분을 XML 태그로 변환하여 번역한 다음 번역이 완료된 후 복원할 것을 제안합니다. 이를 지원하기 위해 번역에서 마스킹할 부분을 지정할 수 있습니다.

--xlate-setopt maskfile=MASKPATTERN

이렇게 하면 파일 `MASKPATTERN`의 각 줄을 정규식으로 해석하여 일치하는 문자열을 번역하고 처리 후 되돌려 놓습니다. #로 시작하는 줄은 무시됩니다.

복잡한 패턴은 백슬래시 에스파스 새줄을 사용하여 여러 줄에 작성할 수 있습니다.

마스킹을 통해 텍스트가 어떻게 변환되는지는 --xlate-mask 옵션에서 확인할 수 있습니다.

이 인터페이스는 실험적이며 향후 변경될 수 있습니다.

OPTIONS

--xlate
--xlate-color
--xlate-fold
--xlate-fold-width=n (Default: 70)

일치하는 각 영역에 대해 번역 프로세스를 호출합니다.

이 옵션이 없으면 greple은 일반 검색 명령처럼 작동합니다. 따라서 실제 작업을 호출하기 전에 파일에서 어느 부분이 번역 대상이 될지 확인할 수 있습니다.

명령 결과는 표준 아웃으로 이동하므로 필요한 경우 파일로 리디렉션하거나 App::Greple::update 모듈을 사용하는 것을 고려할 수 있습니다.

옵션 --xlate--color=never 옵션과 함께 --xlate-color 옵션을 호출합니다.

--xlate-fold 옵션을 사용하면 변환된 텍스트가 지정된 너비만큼 접힙니다. 기본 너비는 70이며 --xlate-fold-width 옵션으로 설정할 수 있습니다. 실행 작업을 위해 4개의 열이 예약되어 있으므로 각 줄에는 최대 74자가 들어갈 수 있습니다.

--xlate-engine=engine

사용할 번역 엔진을 지정합니다. -Mxlate::deep과 같이 엔진 모듈을 직접 지정하는 경우에는 이 옵션을 사용할 필요가 없습니다.

현재 사용 가능한 엔진은 다음과 같습니다.

  • deepl: DeepL API

  • gpt3: gpt-3.5-turbo

  • gpt4: gpt-4-turbo

  • gpt4o: gpt-4o-mini

    gpt-4o의 인터페이스는 불안정하며 현재로서는 제대로 작동한다고 보장할 수 없습니다.

--xlate-labor
--xlabor

번역 엔진을 호출하는 대신 작업해야 합니다. 번역할 텍스트를 준비한 후 클립보드에 복사합니다. 양식에 붙여넣고 결과를 클립보드에 복사한 다음 Return 키를 누르면 됩니다.

--xlate-to (Default: EN-US)

대상 언어를 지정합니다. DeepL 엔진을 사용할 때 deepl languages 명령으로 사용 가능한 언어를 가져올 수 있습니다.

--xlate-format=format (Default: conflict)

원본 및 번역 텍스트의 출력 형식을 지정합니다.

xtxt 이외의 다음 형식은 번역할 부분이 줄의 모음이라고 가정합니다. 실제로는 한 줄의 일부만 번역할 수 있으며, xtxt 이외의 형식을 지정하면 의미 있는 결과가 나오지 않습니다.

conflict, cm

원본 텍스트와 변환된 텍스트는 git(1) 충돌 마커 형식으로 인쇄됩니다.

<<<<<<< ORIGINAL
original text
=======
translated Japanese text
>>>>>>> JA

다음 sed(1) 명령으로 원본 파일을 복구할 수 있습니다.

sed -e '/^<<<<<<< /d' -e '/^=======$/,/^>>>>>>> /d'
colon, :::::::

원본 텍스트와 번역된 텍스트는 마크다운의 사용자 정의 컨테이너 스타일로 출력됩니다.

::::::: ORIGINAL
original text
:::::::
::::::: JA
translated Japanese text
:::::::

위의 텍스트는 HTML에서 다음과 같이 번역됩니다.

<div class="ORIGINAL">
original text
</div>
<div class="JA">
translated Japanese text
</div>

콜론 개수는 기본적으로 7입니다. :::::와 같이 콜론 순서를 지정하면 콜론 7개 대신 사용됩니다.

ifdef

원본 텍스트와 변환된 텍스트는 cpp(1) #ifdef 형식으로 인쇄됩니다.

#ifdef ORIGINAL
original text
#endif
#ifdef JA
translated Japanese text
#endif

일본어 텍스트만 검색하려면 unifdef 명령으로 검색할 수 있습니다:

unifdef -UORIGINAL -DJA foo.ja.pm
space
space+

원본 텍스트와 변환된 텍스트는 하나의 빈 줄로 구분하여 인쇄됩니다. 스페이스+의 경우 변환된 텍스트 뒤에 줄 바꿈도 출력합니다.

xtxt

형식이 xtxt(번역된 텍스트) 또는 알 수 없는 경우 번역된 텍스트만 인쇄됩니다.

--xlate-maxlen=chars (Default: 0)

한 번에 API로 전송할 텍스트의 최대 길이를 지정합니다. 기본값은 무료 DeepL 계정 서비스의 경우 API의 경우 128K(--xlate), 클립보드 인터페이스의 경우 5000(--xlate-labor)으로 설정되어 있습니다. Pro 서비스를 사용하는 경우 이 값을 변경할 수 있습니다.

--xlate-maxline=n (Default: 0)

한 번에 API로 전송할 텍스트의 최대 줄 수를 지정합니다.

한 번에 한 줄씩 번역하려면 이 값을 1로 설정합니다. 이 옵션은 --xlate-maxlen 옵션보다 우선합니다.

--[no-]xlate-progress (Default: True)

번역 결과는 STDERR 출력에서 실시간으로 확인할 수 있습니다.

--xlate-stripe

일치하는 부분을 지브라 스트라이프 방식으로 표시하려면 App::Greple::stripe 모듈을 사용합니다. 이 옵션은 일치하는 부분이 연속적으로 연결될 때 유용합니다.

색상 팔레트는 단말기의 배경색에 따라 전환됩니다. 명시적으로 지정하고 싶으면 --지연 스트라이프-밝음 또는 --지연 스트라이프-어두움을 사용할 수 있습니다.

--xlate-mask

마스킹 기능을 수행하여 변환된 텍스트를 복원하지 않고 그대로 표시합니다.

--match-all

파일의 전체 텍스트를 대상 영역으로 설정합니다.

CACHE OPTIONS

엑스레이트 모듈은 각 파일에 대한 번역 텍스트를 캐시하여 저장하고 실행 전에 읽어들여 서버에 요청하는 오버헤드를 없앨 수 있습니다. 기본 캐시 전략 auto를 사용하면 대상 파일에 대한 캐시 파일이 존재할 때만 캐시 데이터를 유지합니다.

캐시 관리를 시작하거나 기존의 모든 캐시 데이터를 정리하려면 --xlate-cache=clear를 사용합니다. 이 옵션을 실행하면 캐시 파일이 없는 경우 새 캐시 파일이 생성되고 이후 자동으로 유지 관리됩니다.

--xlate-cache=strategy
auto (Default)

캐시 파일이 있는 경우 캐시 파일을 유지 관리합니다.

create

빈 캐시 파일을 생성하고 종료합니다.

always, yes, 1

타겟이 정상 파일인 한 캐시를 유지합니다.

clear

캐시 데이터를 먼저 지웁니다.

never, no, 0

캐시 파일이 존재하더라도 절대 사용하지 않습니다.

accumulate

기본 동작에 따라 사용하지 않는 데이터는 캐시 파일에서 제거됩니다. 제거하지 않고 파일에 유지하려면 accumulate를 사용하세요.

--xlate-update

이 옵션은 필요하지 않은 경우에도 캐시 파일을 강제로 업데이트합니다.

COMMAND LINE INTERFACE

이 모듈은 배포에 포함된 xlate 명령을 사용하여 명령줄에서 쉽게 사용할 수 있습니다. 사용법은 xlate 매뉴얼 페이지를 참조하세요.

xlate 명령은 Docker 환경과 함께 작동하므로 아무것도 설치되어 있지 않더라도 Docker를 사용할 수 있으면 사용할 수 있습니다. -D 또는 -C 옵션을 사용합니다.

또한 다양한 문서 스타일에 대한 메이크파일이 제공되므로 특별한 지정 없이 다른 언어로 번역이 가능합니다. -M 옵션을 사용합니다.

Docker 환경에서도 make를 실행할 수 있도록 Docker와 make 옵션을 결합할 수도 있습니다.

xlate -GC처럼 실행하면 현재 작업 중인 git 리포지토리가 마운트된 셸이 실행됩니다.

자세한 내용은 "또는 참조" 섹션의 일본어 기사를 참조하세요.

xlate [ options ] -t lang file [ greple options ]
    -h   help
    -v   show version
    -d   debug
    -n   dry-run
    -a   use API
    -c   just check translation area
    -r   refresh cache
    -u   force update cache
    -s   silent mode
    -e # translation engine (*deepl, gpt3, gpt4, gpt4o)
    -p # pattern to determine translation area
    -x # file containing mask patterns
    -w # wrap line by # width
    -o # output format (*xtxt, cm, ifdef, space, space+, colon)
    -f # from lang (ignored)
    -t # to lang (required, no default)
    -m # max length per API call
    -l # show library files (XLATE.mk, xlate.el)
    --   end of option
    N.B. default is marked as *

Make options
    -M   run make
    -n   dry-run

Docker options
    -D * run xlate on the container with the same parameters
    -C * execute following command on the container, or run shell
    -A * attach to the live container
    N.B. -D/-C/-A terminates option handling

    -G   mount git top-level directory
    -H   mount home directory
    -V # specify mount directory
    -U   do not mount
    -R   mount read-only
    -K   do not remove and keep live container
    -Q   quit and remove live container
    -E # specify environment variable to be inherited
    -I # docker image or version (default: tecolicom/xlate:version)

Control Files:
    *.LANG    translation languates
    *.FORMAT  translation foramt (xtxt, cm, ifdef, colon, space)
    *.ENGINE  translation engine (deepl, gpt3, gpt4, gpt4o)

EMACS

저장소에 포함된 xlate.el 파일을 로드하여 Emacs 편집기에서 xlate 명령을 사용합니다. xlate-region 함수는 지정된 지역을 번역합니다. 기본 언어는 EN-US이며 접두사 인수를 사용하여 호출하는 언어를 지정할 수 있습니다.

ENVIRONMENT

DEEPL_AUTH_KEY

DeepL 서비스에 대한 인증 키를 설정합니다.

OPENAI_API_KEY

OpenAI 인증 키.

INSTALL

CPANMINUS

$ cpanm App::Greple::xlate

TOOLS

DeepL 및 ChatGPT용 명령줄 도구를 설치해야 합니다.

https://github.com/DeepLcom/deepl-python

https://github.com/tecolicom/App-gpty

SEE ALSO

App::Greple::xlate

App::Greple::xlate::deepl

App::Greple::xlate::gpt3

ARTICLES

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2023-2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.