前几天,帮同学弄字幕,弄了很久,看了许多文章,现在稍微说下基本流程和注意问题。 过程中,用到esrXP、office2010(也可以用其他的ocr识别软件)。 首先,因为一般esrXp可以读avi、rmvb等格式,mp4等可以转成这个格式,再读。其中,如果你电脑读不出rmvb,有可能是没装解码器,下一个rmvb解码器就解决了。 载入视频后,点击字幕,选过滤器。移动进度条,移到有字幕的地方。然后,改区域的数值,使覆盖到所有的字幕。如下图: 然后,可以选完整宽度;接着选颜色及边线,字幕一般白色,边线一般黑色;再点击启用过滤器,点击进阶处理,接下来进阶处理的数值是关键。我设的数值还好,起码能读得出来字幕,虽然不算很清楚。也有很多别的设置值,看你自己的理解吧。我的设置及效果如下图: 选的时候,可以把后处理里面所有的勾全部去掉,这样应该清楚很多。然后拖动进度条,看看别的地方的字幕清不清晰,不清晰的话,还要调进阶设置的值,尽量兼顾所有的字幕,接下来,就可以关掉过滤器,回主界面,点击开始生成字幕图片。 生成完,一般好几千张,可以先保存。打开字幕,点击字幕管理,去掉空白的,合并重复的。在左边打出右边的字幕里的字(对好时间轴),打完就可以生成ass等格式的字幕文件了。(这里也可以用IdxSubOcr来处理,不需要手打) 但是,对于我们不需要做成字幕文件,只要字幕的字的话,可以保存成图片格式,文件>>保存成ocr影像,就可以选,多少张一张图啊,分几行啊自己定义吧。 生成图片后,在office2010的onenote,导入图片,右键,点最后一个,就是“使图像中的文本可搜索”,中英文就看你的文本咯。然后,复制出来就可以了。 提出来的字幕,有一些乱码,很正常,不过只要你设置的好,基本上没什么大的问题,90%左右能识别的出来。我前一次用汉王,感觉好差,也许是我不会用那个,嗯嗯,就说到这里,有问题,欢迎指教。 转自于马甲门论坛
|
|