Skip to content

Feature/Translate 개발 방향 #32

@ale8ander

Description

@ale8ander

오전에 @o-heat 님과 논의한 내용입니다
이번주까지(가능하면 내일 10시 회의 전까지) 번역 품질 향상을 끝내둬야합니다

1. batch 방식 실험 중단

  • 타임 리밋에 늘어남에 따라 추가적인 실험 필요 없어짐

2. 대신에 msgid 하나씩 받아 translate_entry 일일이 실행하는 구조 => 전체 msgid 한 번에? 받아서 실행할 수 있는 구조로 받을 수 있는지 테스트 필요 => (임시 배정: @sihyeon22 )

  • translate_entry 호출시 일일이 prompt와 few_shot exmple 수행하는게 병목 원인으로 보이기도 하고 현재 구조가 비효율적으로 보임
  • batch를 늘리든지, 아예 구조 개편 필요
  • 일단 구조 개편하는게 위험하니까 웬만해서는 translate2.py..와 같이 다른 .py 생성하셔서 작업 부탁드립니다

3. Few shot example 예제 확장 (@o-heat)

  • 현재 랜덤으로 msgid 2개씩 받고 있음 => 랜덤으로 n개 더 받는 건 시간만 늘고 성능 상승은 미미함
  • 랜덤 방식보다는 모범 문서 하나 픽스해서 받는게 나아 보임

4. 프롬프트 테스트 (@o-heat)

  • 일단 최대한 다양하게 많이 테스트

5. translate_entry에 정규식 활용 가능한지 (추후 가능하면)

  • pot 파일 읽을 때 문자 기호나 부호 확인하셔서 좀 걸러서 번역하기 위해 정규식 활용
  • 이 외에도 지금 사용할 수 있는 부분 확인

6. 번역 품질 향상을 위해 현 방법 외에 보다 독창적인 구조 개편 추가 완료- 이건 번역 팀 3분이서 논의 필요합니다

  • 가능하면 금요일 10시 전까지

일단 임시 배정한 건 번역팀에서 변경하셔도 됩니다
이 외에 더 효과적인 방법 있으면 다른 방법으로 진행하시면 됩니다

Metadata

Metadata

Labels

enhancementNew feature or request

Type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions