V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
digiplanp
V2EX  ›  分享创造

做了一个专门翻译漫画图片文字的小工具,分享下实现思路

  •  
  •   digiplanp · 3 月 6 日 · 1221 次点击
    最近在看一些日文漫画和海外 webtoon 的时候,发现一个比较麻烦的问题:
    图片里的文字很难直接翻译。

    普通翻译工具基本都是针对纯文本的,但漫画、截图、气泡对话这些内容:

    文字不可复制

    字体复杂

    竖排/混排较多

    还有多语言混在一起

    后来自己做了一个小工具,主要是把「 OCR + 翻译」流程简化到一步完成,适配漫画和图片场景。

    大致流程其实不复杂:

    图像文字检测(气泡/区域)

    OCR 提取文本

    自动语言识别

    再走翻译模型处理短句对话

    实际测试下来,发现一个有意思的点:
    在这种场景下,OCR 准确率反而比翻译模型更关键,因为漫画字体和排版干扰很大。

    目前这个工具主要用来:

    看外语漫画/生肉

    翻译截图里的文字

    一些图片型内容快速理解

    做成了一个简单的在线版本,省去本地部署和复杂配置:
    https://aimangatranslate.com

    不是做通用翻译的,更偏图片文本场景,所以适用面会比较垂直。

    如果有做过 OCR 或多语言处理的 v 友,也挺好奇你们在复杂排版场景下是怎么提升识别稳定性的。
    5 条回复    2026-03-06 23:43:47 +08:00
    Rebron1900
        1
    Rebron1900  
       3 月 6 日
    生肉有救了
    digiplanp
        2
    digiplanp  
    OP
       3 月 6 日
    @Rebron1900 可以试试效果,有些地方还需要改进,多多指教
    ninjaJ
        3
    ninjaJ  
       3 月 6 日
    沉浸式翻译好像有漫画翻译功能了
    Moear
        4
    Moear  
       3 月 6 日   ❤️ 1
    ZiLong
        5
    ZiLong  
       3 月 6 日
    @Moear 大佬都是怎么找到这些项目的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   931 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:19 · PVG 03:19 · LAX 12:19 · JFK 15:19
    ♥ Do have faith in what you're doing.