分享

外挂内封字幕转内嵌字幕教程(DVD BD .SUP字幕转.IDX .SUB提取OCR识别改字体压制)

 金刚光 2022-01-25

额……朋友们好啊,我图吧老字幕组组长了,最近突然有时间整点二次元的,所以咱就下了一部分21年的番的BDRIP,来源嘛自然是NYAA和36DM之类的BT站,然后也都很规矩的做了种而且上传量远大于下载量

编辑切换为居中

添加图片注释,不超过 140 字(可选)

毕竟咱作为图吧精神领袖天天喷资本家喷吸血雷喷垃圾网盘咱自己可千万不能整吸血这种操作。下载20G上传170G,滴水之恩当涌泉相报了属于是。

然后这里简单说下情况,就是咱其实作为捡垃圾的自己看番并不多,能下BDRIP深入看番的更少,今年不过也就下了几部,自己真能好好看完甚至反复刷很多次甚至出二创出漫评的也就那么一两个(然而还一直咕着)。所幸京都动画比较给力,在经历火劫之后居然还能浴火重生,看得出来这和各位的奋斗也有关系,悲剧的发生只会让幸存者变得更强。不过与其说是悲剧在咱看来不过又是一个神话的破灭罢了,一个人单杀几十人,这就是传说中抗震减灾意识强到爆棚人民素质高到离谱的老京都人的水平,所以从那以后咱再看见谁说日本人安全水平多高咱也就一乐。

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

总而言之龙女仆虽然咱在当年看番的时候也不过是在B站看在线(当时也并不需要什么带会员就能看,和普通视频一样只是卡画质而已),而其内部的价值观和背景咱也是我看不懂但我大受震撼,现在经过简单的研究发现其内部的价值观和神话背景之后咱简单能看出一点点要表达的内容了,不过离能出漫评的水平还是很远的。

这里咱还是做一点浅显的工作吧,这里注意看这个ED的CD里面提供了OP的CV合唱版本,这解释了难怪咱看OP的MV的时候原唱怎么一脸孙笑川的表情,原来是合着自己的戏份被抢了,宁能让CV搁这唱干嘛害找我来呢,应该是这么想的罢。所以咱今天就继续迫害原唱,直接给OP的音频都给你换过来

首先咱其实是在想直接给音频编辑一下直接传就完了,字幕,什么字幕?不做了,B站不是支持外挂字幕吗?咱直接提取一波然后再上传就完事了。结果审核眼瞎,根本看都没看视频,至少里面音频没听,审核不给过,所以咱必须深加工一波了。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

首先啊,非常简单,这里CD给的FLAC是剪切好的,不需要用CUE切WAV,直接拉过来就能用,唯一的问题是音频是全长的OP视频是TV SIZE的,而这里这个CD没提供TV SIZE就比较麻烦,虽然理论上等OST也能有,但是咱显然是不想等,直接切就完事了。这里比较好的是这个TV SIZE和FULL SIZE是没啥太大区别的,就真是TV SIZE唱完之后接上了后面接着唱的部分,所以直接切是可以的,有的CD提供的就不一样,前摇都比较长,那就比较难切,最好直接用OST的TV SIZE(如果有)。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

其实是真的有的,而且有FLAC,只不过这里咱演示的时候还没下到。现在开始码字的时候才开始下,有空给音频替换一次再传吧

添加图片注释,不超过 140 字(可选)

没马的思马杰克丁终于失去了VEGAS的授权,相信索尼也不傻终于看清了这种SIMA二道贩子代理商的本质,当然是拒绝提供授权了。

添加图片注释,不超过 140 字(可选)

所以对于之前WM版本的VEGAS我们可以放心大胆的用了,既不属于索尼(软件签名马克丁)又不属于马克丁(马克丁现在以后和将来都无权代理VEGAS的销售)

PS:索尼的PS现在可以上B站了,看来索尼也要走电视盒路线了,希望索尼能卷死一众电视盒子和智能电视,只能安装云视听小电视之类的那种。

添加图片注释,不超过 140 字(可选)

然后起小丸工具箱194就可以,未必一定要用236,236相比过去只是支持了H265

添加图片注释,不超过 140 字(可选)

简单切好音频之后这不就可以直接拖进封装合并为MP4然后一键替换音频了,然后其实正常这样就可以传了,毕竟音频已经替换完了,视频直接没动相当于给音频轨换过来了而已,这时候上传之后网站管它转不转码正常直接就可以看了。字幕什么的完全可以考虑外挂,到时候再传个提取版字幕就完事了。

添加图片注释,不超过 140 字(可选)

然而审核压根不看内容直接锁我牛子……啊不,视频。

好吧,继续整

添加图片注释,不超过 140 字(可选)

这里说到提取字幕就必须先看一眼这个视频的格式了,如果是BD原盘理论上其实是不需要这么折腾的,只需要用BDMV相关工具就能给字幕整出来了,而咱这个因为是BDRIP,所以在下载省空间且有H265 10BIT的同时,字幕的提取也相对比较熟悉,MKV格式的视频本质上是个容器,内部有音频轨视频轨和字幕,而且支持多轨道,因此只需要用mkvtoolnix里面的mkvtoolnix-gui.exe就可以简单粗暴的给字幕轨提取出来然后另存为.MKS文件,然后你可以重命名为.MKV或者不动,再用gMKVExtractGUI.exe给MKS封装拆了,直接出原字幕文件

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

这里就比较简单了,正常的字幕如果是字幕组内封的.ASS或者.SRT就可以直接扒出来用了

添加图片注释,不超过 140 字(可选)

然而这里这个格式比较特殊,经过简单检查发现是DVD和BD时代用的一种特殊格式.SUP字幕。而这种格式的字幕直接上传到B站也好还是拖进小丸工具箱作为字幕压制也好都是不能用的,一概不认

添加图片注释,不超过 140 字(可选)

现在我们需要做的是利用bdsup2sub++1.0.2_Win32.exe给这个.SUP的封装先拆了,把字幕导出为.IDX和.SUB格式(必须,下一步转换格式操作需要用这两种格式)

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

编辑

添加图片注释,不超过 140 字(可选)

这里的这个LANGUAGE可以设一下也可以不管,本质上对我们整个流程的操作影响不大。

相比现代的.SRT和.ASS等格式的字幕这个字幕最大的问题就是它其实是图形字幕,而不是文字字幕。简单来说就是本质上是带图片的.XML,里面全是图而不是文字,当然这么设计肯定是有它的好处的,就是对于DVD机和BD播放器来说因为不需要本机提供大量的字体文件来做字库,所以可以在比较简单的硬件上实现复杂的字幕字体或者特效,但是对于现代人均普遍PC或者智能手机平板生产力工具看番的我们来说就没锤子用了,而且大多数软件都不支持编辑这种字幕。所以怎么能把图形字幕转为文字字幕呢?

答案是可以使用IdxSubOcr.exe

全称Microsoft Office Document Imaging,是微软Office 2003/2007所带的光学字符识别(OCR)组件,其OCR引擎采用清华文通和ScanSoft的技术,支持21种语言,是一个方便的OCR工具。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

理论上就是用微软OFFICE自带的OCR来识别各种语言的图形字幕然后一键导出为可编辑的字幕,这种OCR技术理论上是一种非常有前途的技术,可以将各种视频中内嵌的硬字幕给转换为可编辑的外挂字幕或者内封字幕,未来可以用来扒各种视频乃至在线番剧影片的字幕并自动打轴。目前这种软件的主要问题是文字识别准确率的问题,还有就是时间轴也需要人来修,很多时候如果错误率太高修起来工作量太大就不如纯人工手扒了,所以这个技术也在慢慢进步,如果需求够大的话将来肯定利用AI也好机器学习也好算法迭代也好会出现更聪明的引擎让软件有更高的识别率的。这里我们用它识别.SUB只是比较简单的应用环境,毕竟.SUB只是图形的文字,而不涉及背景图像的降噪,因此相对来说是比较容易实现OCR光学识别的一个环境。

添加图片注释,不超过 140 字(可选)

这里我们直接点开始然后报错

那就对了,因为咱的WIN7从来都用OFFICE 2007精简版,偶尔还跑2003和2010,这些从来都是默认没有MODI OCR识别引擎的。

添加图片注释,不超过 140 字(可选)

我们需要使用作者马大佬提供的Setup_MODI_OCR_Engine_From_Office2007SP3.exe里面的MODI OCR组件来进行一个引擎的安装,这里各位自己是多少位系统就安多少位的。我这里自己还加戏给自己弄了个号称21种语言的Setup_MODI_OCR_Engine_From_Office2007SP3.exe,其实并不是很需要,只需要用大佬提供的精简版就可以了,毕竟你日常也就用个中日英法俄德西,朝鲜话都用不上。

添加图片注释,不超过 140 字(可选)

这里全部选是

添加图片注释,不超过 140 字(可选)

然后就可以开心的OCR了

添加图片注释,不超过 140 字(可选)

?给爷识别出来全是空白可还行,我是要你给我打轴还是要你给我识别字幕

添加图片注释,不超过 140 字(可选)

这里看了一眼软件版本号,发现这个软件新版本有报识别空白字幕的反馈不少,建议是换1.14解决问题

添加图片注释,不超过 140 字(可选)

我这边双管齐下顺手还把号称21种语言的Setup_MODI_OCR_Engine_From_Office2007SP3.exe装上了,排除一下引擎的问题。

添加图片注释,不超过 140 字(可选)

然后能用了

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

这里我们需要给这个语言设定一下,然后选择文字颜色

添加图片注释,不超过 140 字(可选)

只有当显示出来的是这样的白纸黑字的时候才能正常识别

其实识别效果还可以,错误不可避的肯定是有,但是不多啊,不多。

添加图片注释,不超过 140 字(可选)

这里利用辅助功能的文本替换就可以简单修正一些批量的错误了,因为是OCR其实识别出来的错误都是比较统一的,不存在同样的图像识别结果出来的文字错误不同的情况。

添加图片注释,不超过 140 字(可选)

简单一顿CTRL+F然后看了一眼没啥问题就可以保存导出了。其实修改过程中也应该经常保存,以免不慎关闭软件丢进度

添加图片注释,不超过 140 字(可选)

看了一眼差不多得,毕竟不是什么正经拿钱干活的场合,别错的太离谱就行,当然不是说鼓励收费字幕组的存在的意思,只不过是说反正只是玩玩又不是给人做正版字幕拿钱干活所以不用太讲究,字幕稍微有点错误反倒容易让人看出来咱的工艺就是OCR识别BD字幕,而不是用.LRC之类的歌词改的.ASS字幕。

添加图片注释,不超过 140 字(可选)

试看一下发现还可以,这里我们就能发现亿点点问题了,我们用的这个文字字幕好像暂时不能简单的打出这个音符符号,不像码字的时候随便能用各种特殊符号打♪,这就比较麻烦了,所以我说存在即合理,京阿尼2021年还在用的.SUP图像字幕还是有用的。

添加图片注释,不超过 140 字(可选)

这里含泪给这个所有的音符汉字都删了

添加图片注释,不超过 140 字(可选)

然后发现这个字幕的字体和字号其实还可以,但是为了美观肯定得改。

PS:顺便说下OCR识别字幕并不是只有用MODI一种办法,也有其他的第三方软件也能实现,比如对于西语的场合很多人推荐的Subtitle Edit就可以识别

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

然而咱实测对于日文假名汉字因为缺少相关引擎咱又懒得专门去下所以识别效果不佳,还有就是其实对英文也识别不咋地,你看一个好好的单词识别出来的空格位置都不对,还得挨个去改,所以这个软件的可用性还有待评估。

编辑

添加图片注释,不超过 140 字(可选)

然后其实这里就可以简单压字幕进视频了,这里咱使用的是小丸工具箱236,支持H265。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

结果发现渲染了个寂寞,渲染出来的文件根本找不到,一看日志好嘛视频轨就没找到可不渲染不出来视频。所以这里其实这个软件我们能发现是有一点问题的。

添加图片注释,不超过 140 字(可选)

所以简单切个格式工厂试试看看是不是原视频给了什么特别的编码或者封装,加了锁?有的字幕组也好汉化组也好会给自己的作品加一些类似锁的东西,让其他人难以修改作品的内容,之前咱就见识过山樱组放源的生肉PNG源是无法编辑的,保存不了,所以当时咱直接另存为JPG才解决,然后果不其然因为咱眼瞎当时只会上NYAH看不到汉化版所以撞了个稀碎。这里咱怀疑是不是也有这种可能,结果发现并不是,格式工厂就能好好的压上片,而且压H265毫无压力。

添加图片注释,不超过 140 字(可选)

本期我们用的自然是垃圾佬的主力机也是未来很长时间也会一直在用的一代神机,HP 8770W,3820QM的U可以全核3.5G,而这个17寸铝合金的模具则可以压住这个45W TPD的U跑全核睿频的同时GPU满载。CPU和显卡都是双热管散热规格很不错,想想十几年前IBM T21的时代才刚刚出现热管散热的笔记本,图拉丁奔腾3的IBM T23甚至都不需要上热管散热只需要用一块铝合金散热片就能解决散热的需求,2000年到2013年还真是个快速发展的时代。

这里必须说下,提高配置提升渲染速度最终也只是降低试错成本而已,这活如果开个64位的P8600其实一样能干,就是需要更长的时间,其实32位的奔腾M或者奔腾3单核理论上也行,当年珊瑚老哥做动画MTV的时候不也就用个IBM T23,咱当年当UP的时候手里不过是个AMD X2 240+GT240啊,这还是全家最好的了,当时真的难受,SONY笔记本的模具其实是压不住I3 2330M+AMD HD6000M长期满载的,而台式机嘛渲染个几分钟的1080P H264视频就直接一小时起步了,有时候咱会为了省点时间而选择放弃1080P而渲染720P,当时素材的水平也不是很高,720P也完全可以来着。至于4K是什么东西咱当时都不敢想,咱当时想的是1080P要是能直接随便渲染想怎么玩就怎么玩就好了。

添加图片注释,不超过 140 字(可选)

完成

添加图片注释,不超过 140 字(可选)

这里简单看了一下情况,发现渲染是成功了,但是又没完全成功

添加图片注释,不超过 140 字(可选)

首先这个画质明显不对劲,这明显看着就是糊了,虽然有1080P但是肯定是码率没上去

添加图片注释,不超过 140 字(可选)

一看码率好嘛2500K可还行,还是8BIT H265,肯定不够,和原视频都有一个数量级的差距了

添加图片注释,不超过 140 字(可选)

回溯一下原来的原视频码率,发现即使在H265 10BIT下也有20000+的峰值动态码率

添加图片注释,不超过 140 字(可选)

所以改个参数接着玩,码率提起来,CRF嘛咱比较不讲究,直接用小丸工具箱里面默认的23.5,这里可以调10-40,各位见仁见智了

添加图片注释,不超过 140 字(可选)

然后还没完,字幕虽然有了但是咱需要改字体让它更好看或者说更接近原版。

SRT字幕的修改方法如下:

以记事本或者其他文本编辑软件打开.SRT字幕,然后按以下语法修改字幕:

以下语法需要放在时间和文本之间

字幕字体颜色的基本格式为<font color=XX>

XX为字幕的颜色英文名称,如显示红色为<font color=red>

也就是说,把你需要显示的颜色,使用颜色英语单词替换就行了

除了可以使用颜色的英文词,还可以使用256位色号

如把取到的色号按格式替换为<font color=#ED935E>

字幕字体调用格式为{\fn字体名称},拆开就是Font Name的意思

那怎么更改字体大小呢?单独{\fs字号大小}使用,也可以配合{\fn}使用

SRT字幕默认字体大小为20号,这个可根据个人爱好调整

添加图片注释,不超过 140 字(可选)

这里我们先安装一波字体,以免因为缺字库没有对应字体而导致压片渲染失败,那就乐了。

添加图片注释,不超过 140 字(可选)

这里我们随便按语法改一句字幕看看,发现可以正常播放,没问题,这样理论上压片也没问题了。

添加图片注释,不超过 140 字(可选)

不过这个.SRT字幕什么都好,就是字体得挨个改,每句都得照顾到,很麻烦,远远不如.ASS好用,字体直接指定一段话就全定义了。

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

所以尝试用AEGIS给.SRT字幕打开另存为.ASS,结果说什么不识别文字编码可还行

添加图片注释,不超过 140 字(可选)

尝试随便找个在线工具转换

添加图片注释,不超过 140 字(可选)

结果真不识别,好吧。所以只能接着改.SRT

这里我想到了一个问题,既然要逐句改那就好好改,京阿尼字幕用的是什么字体?

简单给这个字幕截个图在线识别一下吧

添加图片注释,不超过 140 字(可选)

结果发现这个空心字在线网站根本识别不了,所以还得动PS

添加图片注释,不超过 140 字(可选)

这里咱刚才手欠给自己机器上字体安装了太多导致PS7.0打不开,只能被迫用PS CS5,怀疑是某个字体卡BUG了导致PS7.0无法启动

添加图片注释,不超过 140 字(可选)

总之一顿操作给文字修好了就可以识别了,什么反色色彩范围油漆桶套索之类的细节就不用我说了吧,各位其实需要知道的只是结果,就是到底用什么字体对劲就可以了

添加图片注释,不超过 140 字(可选)

这里需要眼看这个字然后给一个人工识别字符结果

编辑切换为居中

添加图片注释,不超过 140 字(可选)

然后发现好嘛好像识别不太出来,高相似度的结果一看就不对,反倒最下面这个看着有点对劲

编辑切换为居中

添加图片注释,不超过 140 字(可选)

去隔壁直接下载

添加图片注释,不超过 140 字(可选)

结果到了安装的时候发现好像确实不太对,这能是京阿尼那个字幕吗

添加图片注释,不超过 140 字(可选)

没办法感觉识别不是很准按同样的方法重来识别汉字试试,发现还是一样人工智障,所以这时候姑且可以判断是因为这个玩意的字体库不行了,应该是不全,看这个字怎么看怎么都像圆体嘛,随便找个圆体得了。

添加图片注释,不超过 140 字(可选)

咱之前字幕组里面存的字体就有日文字体,当然即使各位没有字幕组如果各位经常看番下BT源的外挂字幕或者内封字幕那字幕组是一定会提供各种字体的,其中肯定会有这样的日文圆体粗体字体,直接找出来用就完事了

添加图片注释,不超过 140 字(可选)

这样就看着像是那么回事了,然后接着整渲染压片,嵌进视频

添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)

结果格式工厂拿.SRT语法当放P,根本原封不动一句话的字体没改,所以没法用了,当然你说这个视频也能看是真的,但是和做字幕的目的来说差的还是有点远。

添加图片注释,不超过 140 字(可选)

所以这里随手点了个小丸工具箱194结果发现居然能用

添加图片注释,不超过 140 字(可选)

好嘛,字体是成功的压进去了,就是这个画质又崩了,简单调一下CRF参数到20

添加图片注释,不超过 140 字(可选)

20还是不太行

添加图片注释,不超过 140 字(可选)

视频确实比原来大了一些,但是显然不够,CRF直接给10吧

添加图片注释,不超过 140 字(可选)

这次看着没啥问题了

编辑

添加图片注释,不超过 140 字(可选)

这个水平就差不多,可以直接传了

编辑切换为居中

添加图片注释,不超过 140 字(可选)

其实以现在的水平来看200M左右的视频也根本用不了多长时间了。现在没事用手机拍个4K H265视频动辄论G算也一样能好好上传,过了年家里直接加钱上千兆外网更是用不了多长时间很快,很快啊,网速就上去了。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

啊这

编辑切换为居中

添加图片注释,不超过 140 字(可选)

好家伙,宁这也太能卷了,不过没关系啊,咱有字幕。回头咱投稿的时候再换个音频轨再换个【字幕特效】标题就好了,所以说这里也能看出来,B站审核根本不看视频,看一眼标题一看有同类就直接给你锁了。别锁视频,来锁我牛子好不好啊?要么宁就看看视频再操作⑧,秋梨膏。

正好写到这里FLAC的OST也下完了,打开OST看看有没有TV SIZE的合唱版OP

编辑切换为居中

添加图片注释,不超过 140 字(可选)

好家伙,那没事了,没有OP,但是有单摘出来的OP和第一季OP的合唱,我一看这我可以直接水6期了,还有不知道这个动画制作委员会是咋想的,这是肯定没有第三季了是吗,你这么折腾一顿操作原唱还会给你接着唱OP吗?下次怕不是辞病直接推掉OP的演唱了。

所以各位要看视频效果就直接看这里吧:微博视频 小林家的龙女仆S OP版本替换 愛のシュプリーム! (スーパーちょろゴンず Ver.)(BD原版字幕提取) 回头我再替换几个音频轨然后上B站水更新去,就这样,谢谢朋友们!

PS:差点忘了工具软件的提供,各位有兴趣参加字幕组的可以直接到失传技术字幕组群获取,这里同时也提供网盘链接(微云),如果资源失效本文的这些软件找起来也不是很麻烦,基本都是比较容易找到的,所以就这样吧。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多