引言
最近租的房子快到期了,哎,因为去年是第一次找房子租,结果遇到了一个东北黑中介,押一付三,房子有啥问题,灯坏了,下水道堵了,原来签合同的时候说的客气,说是马上就会上门解决,结果实际上我每次找他,都是各种推脱,最后不了了之。全部是我自己想办法解决的。现在又打电话催着我要搬走,押金也不打算退给我了。真的是rlgl。我反对地域黑,但是以后东北的中介一生黑。(再次声明,不是地域黑,我也有认识的人很好的东北的朋友。)今天我又看到了有钱可以为所欲为
的经典gif,所以我心血来潮想做一个自己的东北黑中介
版的为所欲为
gif。本来我想找一个没有文字的gif,然后找一个软件添加文字,然后合成gif的。结果在网上搜索了一下,没有找到合适的原版gif,只找到了一个有文字的gif。到是有软件可以手动添加文字合成gif的,但是如果要首先把原来的文字去除,然后再一点点添加,手动要做大量的工作,很是麻烦。我再尝试了半个小时还没弄好就放弃了(但是我想应该有比较简便的方法,只是我懒得再自己去找了)。最后我想既然作为一个程序员,能不能通过代码去实现这个功能呢?当然可以啦。我最熟悉的是python,自然优先考虑上python了。之前接触过PIL这个库,我记得它有给图片添加文字的功能,而且最近不是才刚刚看了moviepy这个库,它可以很容易合成gif,把这两个结合到一起不就很容易实现我想要的目标了吗?一不做二不休,开搞!
1. 处理gif以及基本思路
我找到的原始的gif如下图1所示:
如果你的电脑已经安装了ffmpeg的话,那么将gif分割成单帧的序列图片是非常容易的,运行下面的命令:
1 | ffmpeg -i 为所欲为.gif %d.jpg |
就可以将
为所欲为.gif
分割成1.jpg,2.jpg,…。当然你也可以直接使用python的PIL库来处理gif,使用如下的代码即可:1 | from PIL import Image,ImageSequence |
或者你也可以使用之前介绍过的moviepy库(具体可以参考我之前的一篇博客),如果你对opencv比较熟悉的话,自然也可以使用opencv来处理。这里就不详细说了。
得到gif的帧序列图像之后,简单来说一下后面处理的思路。因为原来的gif有些帧是有文字的,我们要想添加自己的文字,就必须要把原来的文字去除掉,然后换成自己的。所以后面基本的思路就是:
- 找出那些有文字出现的帧,把文字去除;
- 原来的文字去除之后,替换成自己的合适的文字,形成新的帧图像;
- 将新的帧图像合成为新的gif(这里使用moviepy合成)。
2. 实现代码以及简要解析
具体实现代码如下:
1 | # -*- coding:utf-8 -*- |
上面的代码思路其实还是比较清楚的。主要麻烦的地方就在于,我们没法自动确认哪些帧出现了文字,所以在这里我采用手动观察图像(有167张图)的方式,确定了出现文字的帧序列区间;然后对于这些帧序列区间,其文字替换成我自己的文字。还有一个问题就是,我要消除文字,就要知道文字的位置,其实这个可以归结为一个目标检测的问题,或者说是一个OCR问题(OCR的第一步,定位文字),但是OCR做起来还是很麻烦的,这里暂时不说,后面有空我会专门讨论OCR问题。这里比较好的地方在于,所有的文字出现的高度位置几乎是一样的,只是宽度方向的位置不一样(有的字多,有的字少),这里我还是采用手动观察标注的办法,可以借助于matplotlib显示图像,用鼠标点击图像的某一点,它会显示该点的(x,y)坐标和像素值,这样我们就可以手动确定要消除的文字的位置,以及消除文字要填充的颜色了。按照这个思路,我们可以得到一些消除原来文字,添加新文字之后的图像如下图2所示:
最终合成的新的gif如下图3所示: