YouTube 网红程序员,修复美、日、俄多国古老街景视频

油管上一位 Up 主,修复历史视频上了瘾。目前,他已经利用 AI 技术修复了百年前的纽约、东京等地的街头视频。继上次感受百年前老北京街景之后,让我们穿越到百年前的东京、纽约街头看看吧!

还记得曾火爆全网,用 AI 修复的百年前北京街景视频吗?(参见《AI 修复民国北京街景视频,火遍全网带你穿越》

同一时期,全球其它城市又是什么模样?一位来自俄罗斯的工程师 Denis Shiryaev(丹尼斯·谢里亚耶夫),用 AI 技术修复了多部老视频,也在 YouTube 上火了一把。

从 1896 年的莫斯科,到 1911 年的纽约,再到 1913 年的东京,Denis  让网民们感受到了百年前,这些城市的风情。

修复《火车进站》一战成名

今年 2 月,Denis Shiryaev 在 YouTube 上传了一段用 AI 技术修复的人类史上第一部电影——《火车进站》。

让他意外的是,这段视频一夜走红,截至目前这段修复电影已达到 400 多万次的播放量。 

修复后的彩色有声版《火车进站》

125 年后,原本仅仅 50 秒的无声黑白电影,被 Denis 利用 AI 技术加上了色彩,并将其升级为 4K、60 fps 画质的高清版本,让现在的我们,得以看到更加真实的历史画面。

纽约、东京、莫斯科视频修复:给网友交作业

在第一次的修复作品获得巨大反响之后,Denis 应广大网友请求,接着又修复了多段老视频,带大家感受百年前的莫斯科、纽约和东京。

中图为 Denis Shiryaev 

 1896  莫斯科:热闹的商业街头 

Denis 的 AI 时光机,首先选择了 1896 年的莫斯科,这座城市于 1147 年沿莫斯科河而建,至今已有近 900  年历史。

19 世纪末的俄罗斯,刚刚完成工业革命,各类工业和贸易的企业已达两万多个,工人人数达到了 12 万。

特维尔大街,至今仍是莫斯科最繁华的商业、娱乐中心

视频中所记录的正是莫斯科的特维尔大街,商铺林立,马车、警察、商人熙熙攘攘。

沿着这条街步行不到 2 公里,即可到达当时的沙皇住所,也是现在俄罗斯的总统府 —— 著名的克林姆林宫。

 1911 纽约:欧洲移民的美国梦 

Denis 还选择了 1911 年纽约市的一段著名视频,进行了修复。

这段时长 8 分 35 秒的视频,把人们带回到 1911 年,当时的美国,正处于快速城市化时期,第二次工业革命在美国创造了大量就业机会。

原片由瑞典某公司拍摄,名为《纽约之旅》,

由现代艺术博物馆于 2018 年公开

19 世纪末 20 世纪初,大批因社会停滞而陷入失业的欧洲人,选择远渡重洋去追寻「美国梦」。

来自欧洲的移民潮达到高峰。其中最著名的就是 1912 年 4 月,从英国出发的泰坦尼克号。

在《纽约之旅》的开头中,也是一艘游轮缓缓驶向高楼林立,车水马龙,繁华热闹的纽约。

 1913-1915   东京:明治维新后的稳定繁荣 

这段原素材,由外国摄影师在 1913 年至 1915 年间的日本东京拍摄,拍摄期间,第一次世界大战(1914-18 年)刚刚拉开序幕。

而此时的日本,经过明治维新后的数十年平稳发展,正是一片盛世。东京的人口恢复到明治维新前的最高水平,超过 200 万人。

网友评论:那时候人们盯着摄像头就像它是一个外星探测器一样

街头上身着西服的日本老师,头戴礼帽的路人,无不体现着当时的日本,正经历着西方文化与东方文化交融的变革时刻。

感觉还不过瘾的同学,可以去 Denis 的 YouTube 主页,继续时光之旅哦:

https://www.youtube.com/c/DenisShiryaev/videos

能够实现这些结果,Denis Shiryaev 谦虚地表示,都要归功于 DAIN、ESRGAN、DeOldify 等 AI 技术。通过这些技术,任何人都可以做到。

老视频修复三步套路:提升画质、插帧、上色

  提升画质利器:Gigapixel AI

据 Denis 介绍,他首先使用了 Topaz Labs 开发的商业图像编辑软件 Gigapixel AI,将原本分辨率极低的视频,按比例放大 600%,提升为 4K 画质。

Gigapixel AI 的工作原理类似于 ESRGAN(一种超分辨率复原技术),利用其专有的插值算法(interpolation algorithm),可以分析图像并识别细节和结构,进一步「完成」图像 。

为了避免放大后的图像模糊,该软件利用深度卷积神经网络技术,分析了数百万张成对的图像,了解图像中的细节如何丢失,然后在新图像中将细节填充进去。

该软件已支持常见的视频格式无损放大

  补帧模型:DAIN

接着,Denis 使用深度感知视频帧插值模型 DAIN,在现有视频片段的关键帧之间,靠模型的「想象」创建并插入视频里以前并不存在的帧,以此将视频的帧率增加到 60 帧每秒。

DAIN(Depth-Aware Video Frame Interpolation)是上海交通大学一位博士生包文博开发的插帧算法,该算法可以从把 30 帧的视频「脑补」成 480 帧,让视频更流畅。

项目地址:https://github.com/baowenbo/DAIN

将 30 fps  视频补帧到 60 fps 后的效果对比

  上色:DeOldify

在上色环节,作者使用了 DeOldify,该技术的开发者目的就是为旧照片着色。其原理是使用 NoGAN 技术,它结合了 GAN 训练的优点,比如出色的上色效果,同时也消除了一些副作用,比如画面着色不稳定、闪烁的现象。

项目作者给出的上色示例,原照片拍摄于 1890 年代后期

项目地址:https://github.com/jantic/DeOldify

最后,对于早期的一些无声视频,Denis 还为其加上了一些和视频相对应的音效素材,让整体的视听效果更为真实。

Denis 表示,自己热爱机器学习技术领域,修复古老视频只是他对这种技术应用的结果展示。他会继续在 GitHub 上寻找此类技术,并在博客持续分享自己的学习结果。

1988 年出生的 Denis 经常在 Instagram 上晒一些旅行照看来是一位热爱技术也热爱生活的小哥哥

—— 完 ——