俄版百度44.7G源码泄露!遭前员工背刺,涉及搜索地图等主要服务

鱼羊 Pine 发自 凹非寺

量子位 | 公众号 QbitAI

俄罗斯第一大科技巨头,这回遇上了烦:

44.7GB源代码,全被泄露到了网上。

什么概念?

就是这家名为Yandex的公司,几乎所有主要服务的源代码都被挖了个底掉……

要知道,在俄罗斯,Yandex不仅干着搜索引擎的活儿,还把俄国老百姓购物、打车、订外卖、租车这一连串生活服务都给包圆了。

简单来说,约等于俄版百度+淘宝+美团+滴滴。

这么大个事儿,自然引起了全世界网友的围观。

但就在众人纷纷猜测这又是哪家黑客手笔之际,Yandex的声明却有些令人大跌眼镜:

我们没有被黑,就是被前员工给卖了……

具体来说,泄密链接最早出现在了一个黑客论坛上。

泄密者称,这份44.7GB的Yandex代码库,包含该公司2022年7月以前,除反垃圾邮件规则之外的所有源代码。

这些被泄露出来的代码信息量到底有多大?

看看网友们热火朝天扒出来的细节就知道了……

Yandex不是以搜索引擎起家,常被称作“俄版百度”/“俄版谷歌”嘛,那就先以搜索引擎部分的代码为例。

一位名叫Alex Buraks的老哥就深扒了下Yandex搜索引擎的排名规则,还戏称这对理解谷歌SEO(搜索引擎优化)有很多有用的信息。

毕竟Yandex和谷歌的搜索结果有70%的匹配度,不少人认为其搜索技术用的就是谷歌同款:如PageRank、BERT等。

(掌握了Yandex的规则不就相当于透了谷歌排名算法的家底,手动狗头)

目前已经有大批吃瓜群众来围观,甚至Alex Buraks的这条线程曾在谷歌搜索“yandex”中排名第8。

有趣的是,在Yandex的排名因素中,排在第一个的就是PageRank

Buraks还直接列出了Yandex的10个排名因素:

(1)链接的创建时间;(2)流量和有机流量的百分比;(3)URL中的数字不利于排名;(4)URL中的斜杠不利于排名;(5)负面情绪过重的PageRank=0;(6)主机可靠性;(7)“维基百科”还单独列了一个因素

;(8)用户行为:点击率,跳出率等;(9)文件年龄与上次更新日期;(10)所有查询域名的平均位置……

当然这还只是其中的一部分,Buraks表示后续还会继续分析。

除了Alex Buraks,也有不少营销大师深扒了Yandex的排名因素,甚至有人都详细整理出了完整的1900+个排名因素。

值得一提的是,在各路大神扒代码的过程中,Yandex搜索引擎的一些“潜规则”也被摆上了台面。

就比如说加拿大黑客Aubrey Cottle就在代码中发现了Yandex是容忍种族歧视的。

还有网友在代码中发现,Yandex的广告投放中,普通广告和广告是分开计算的。

这事儿一出,很快还有一份详细的泄密文件目录被整理出来放在了GitHub上。

作者是一位名叫Arseniy Shestakov的软件工程师。据他评估,这些源代码确实涉及了Yandex的所有主要服务。

包括:

  • 搜索引擎和索引机器人
  • 地图服务
  • AI语音助手
  • 打车服务
  • 广告服务
  • 邮件服务
  • 存储服务(类似百度网盘)
  • 电商服务(类似淘宝)
  • 旅游服务
  • 云服务

还包括在线协同办公、支付、数据分析等等业务。

不过,泄露内容并不包括用户数据等敏感信息。

Arseniy Shestakov总结了几个关键细节:

  • 泄露出来的主要是git存储库里的源代码,不包含git历史记录
  • 所有文件日期均可追溯至2022年2月24日
  • 大部分软件都没有预先编译好,只有少数例外
  • 除了一些例外,没有预先训练好的机器学习模型

事情闹得这么大,Yandex官方也坐不住了,很快发表声明表示:其实我们并没有被黑,是前员工出卖了我们!

Yandex没有被黑。我们在公共领域发现了泄露自内部存储库的代码片段,但其内容与Yandex当前使用的代码版本并不相同。

存储库是用来存储和处理代码的工具。大多数公司都采用这种方式来使用代码。

代码库并未存储个人用户数据。

我们正在进行内部调查,但并没有发现该事件给用户数据和平台性能带来了任何威胁。

Yandex倒是信誓旦旦,但外部的专业人士却有不同看法。

据bleepingcomputer消息,前Yandex技术专家Grigory Bakunov对此事做出了回应。

他认为,这次代码泄露确实不会对用户的隐私或安全构成直接风险,也不会直接威胁到Yandex的专有技术。

不过一些文件仍可能会暴露正在运行的服务,比如说“blacklist.txt”,Bakunov还称:

尽管泄密的部分不涉及敏感数据,但黑客针对性利用代码中的安全漏洞,只是时间问题;

(BTW)虽然Yandex官方回应泄露的代码与公司工作服务中使用的当前代码不同,但相似度可能高达90%。

泄露代码目录:https://gist.github.com/ArseniyShestakov/53a80e3214601aa20d1075872a1ea989

参考链接:[1]https://www.bleepingcomputer.com/news/security/yandex-denies-hack-blames-source-code-leak-on-former-employee/[2]https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/[3]https://twitter.com/Kirtaner/status/1619007274202329091[4]https://twitter.com/dom_woodman/status/1619028740201398274[5]https://twitter.com/alex_buraks/status/1618988134850785280

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

PotPlayer 篇二:PotPlayer播放器LAV+Xysubfilt配置指南

创作立场声明:本文为PotPlayer篇一【调校篇】的补充,有什么不周到的还请指教,谢谢!

我昨天发布了一篇关于windows电脑端的Potplayer播放器的安装及基本调校,得到了很多值友的关注并评论,再此我对大家表示衷心的感谢!特别是在评论区对我的操作步骤提出改变和优化的值友们,也就是因为有你们才让我们有着共同爱好的人有更多的话题,更多学习的空间,谢谢!

其实严格来说,我只是一个纯粹的数码爱好者,也比较喜欢折腾,写的东西在专业人士看来都是班门弄斧,甚至有的东西还漏洞百出,不过我也是一个爱学习并且能听取意见和建议的人,所以有什么不对的还请各位大神们不吝赐教,谢谢!

由于我的疏忽,篇一【调校篇】的PotPlayer的官网下载地址虽然也能下载,但是并不准确,所以今天再次更正一下,顺便再次把需要用到的组件链接和网盘地址也再次发一遍。

  • potplayer本体下载:https://potplayer.daum.net/
  • madVR的下载链接:http://www.madvr.com
  • LAVFilters的下载链接:https://github.com/Nevcairiel/LAVFilters/releases
  • XySubFilter的下载链接:https://github.com/Cyberbeing/xy-VSFilter/releases
  • 篇一里面的网盘新增了今天要说的XySubFilter字幕插件,并且百度网盘里面还有一个4K和一个8K的HDR视频供大家测试!需要的可以在上面篇一【调校篇】中直接下载就可以了。

XyVSFilter是目前较为主流的字幕插件,如果有朋友不需要播放器内置的字幕显示,可以考虑外挂XyVSFilter,而XySubFilter是在XyVSFilter基础上针对madVR开发的一款字幕插件。

由于昨天时间仓促,在写好以后才发现字幕插件还没有加载进去,所以各位值友只需要把电脑系统对应XySubFilter直接安装就可以了。以我分享出来的网盘包里面的文件为例,因为我的电脑是64位的操作系统,所以:

NO.1,打开“XySubFilter_3.1.0.752_x64”文件夹,如果你操作系统是32位,则打开“XySubFilter_3.1.0.752_x86”就可以了。然后单击【2】文件,记得在【2】步骤的时候鼠标右键,选择“以管理员身份运行”,最后就可以看到“已成功”的提示。

NO.2,然后我们打开potplayer播放器,和上篇【调校篇}一样,鼠标右键打开“选项”,或者直接快捷键“F5”也可以,然后按照下图一步步的配置就可以了。请记得【6】步骤,我们的最终目的是对每个滤镜设置强制使用

到此,上篇【调校篇】中遗漏的字幕插件也算补上去了。

因为篇幅的关系,我们这篇先对LAV+Xysubfilt这两个插件进行必要的配置和说明。下一篇我们再单独对madVR插件进行配置和说明。

我们一般情况下,需要关闭 Potplayer 默认字幕,防止出现双行字幕。外挂字幕文件可以通过“同路径下相同文件名”的方式被自动载入。但是 xy-SubFilter 无法渲染图形外挂字幕 PGS 与 SUP,这些字幕仍然需要开启 PotPlayer 默认字幕进行渲染。

关闭 Potplayer 默认字幕的方法:打开potplayer,空白处鼠标右键,按照下图操作,在《2》的位置取消前面的“✓”就可以了。

请记住外挂字幕的必要条件:同一文件夹,同一文件名!两者缺一不可!一般操作是下载对应的字幕,如果字幕不一样就重命名字幕名,和视频名一样,然后放在一起就可以自动加载字幕了。如下图一样:

值得注意的是,使用 xy-SubFilter 之后,你将无法使用拖拽字幕文件到 PotPlayer 的方式来让 xy-SubFilter 加载字幕。如果 你对拖拽字幕功能需求强烈,你仍然需要使用 PotPlayer 默认字幕进行渲染。

xy-SubFilter字幕插件是否开启可以看下图,如果能显示【2】中所示就说明已经成功启用了xy-SubFilter字幕插件,前提是必须有外挂字幕文件,一般madVR都会优先选择XySubFilter的。

还是打开potplayer的设置界面,然后按照下图一步步打开。一般在下图这个页面是没有什么需要动的,保持默认即可,需要说明的是左下角的【4】勾选后,在启用LAV音讯解码器时,会在电脑右下角工作列的通知区域內显示图示。(依需求选择勾选)

Enable Mixing(开启混音)【3】勾选后,便可以將 多声道音轨 混和成 较少声道数 输出,输出声道可以在Output Speaker Configuration(输出扬声器设置)中设置,依照声道数设定。

Mono:单声道Stereo:立体声/双声道4.0:4.0声道5.1:5.1声道6.1:6.1声道7.1:7.1声道

右方Setting(设定)选项中,Clipping Protection(音量保护),可以使扬声器在大动态音频输出时,降低破音机率。(如果对扬声器有信心,不建议勾选此项,因为可能会损失音质)

设置好以后记得点【5】,应用即可。

和上面一样,按照下图图示打开LAV Splitter Source分离器部分的设置。

图示中的Audio(音频)及Subtitles(字幕),可以设定优先的轨道,可以依自行需求设定,

在【4】内以下几种选项可选:

No Subtitles:不载入任何字幕

Only Forced Subtitles:只选择有强制轨(forced track)的字幕

Default:选择有强制轨(forced track)或预设轨(default track)的字幕

Advanced:选择在Subtitles的栏位中填入选择逻辑

在【5】內,Prefer Audio Stream with the Highest Quality (偏好最高音质音轨)此项可以视情况勾选,勾选后LAV会倾向选择最高音质的音轨,但少数影片最高音质的音轨不一定是对的/最好的。

左下角的【6】勾选后,在启用LAV分离器时,会在电脑右下角工作列的通知区域內显示图示。(依需求选择是否勾选)

同样的方法,打开LAV Video Decoder视频解码器的设置界面

左上角Settings(设定)选项中,Threads for Multi-Threading(设定多执行续的执行数),基本上设定成Auto(自动)即可。

Setting for Interlaced Video Streams(设定隔行扫描影片):

Field Order(场序规则),在处理格行扫描影片时需要先进行去交错,而反交错时分成 奇数场 优先或是 偶数场 优先,可依需求设定,或是设定成Auto让LAV自动判断。

在【4】中,有几种选项,

Auto:自动。

Agressive:当影片中发现有格行扫描的画面时,则全部进行去交错处理。

Force:强制进行去交错处理。Disabled:关闭去交错处理。

至于第【5】,简单来说就是选择要用何者来进行硬体解码,有以下几种选项,

NVIDIA CUVID:Nvidia专用硬体解码介面,可以开启硬体去交错处理。Intel QuickSync:Intel內显专用硬体解码介面,CPU使用率比其余硬解模式稍高5~10%左右,可以开启硬体去交错处理。DXVA2 (copy-back):为微软开发的硬体加速介面,ANI显示卡均可使用,会將解码完成的资讯回传给记忆体,由於多个回传动作,故效能会比native略差,不过优势为可以在解码器与渲染器中间添加滤镜。DXVA2 (native):为微软开发的硬体加速介面,ANI显示卡均可使用,会將解码完成的资讯將不会传给记忆体,直接渲染,故效能比copy-back佳,缺点为限制较多。

如果要开硬解,建议 DXVA2 (native) > DXVA2 (copy-back) > NVIDIA CUVID 或 Intel QuickSync(原版则建议使用DXVA2 (copy-back))

右下方的Hardware/GPU Deinterlacing (CUVID/QS only),即为硬体去交错处理设定,限定在NVIDIA CUVID或Intel QuickSync硬解模式下启用。

Software Deinterlacing(软体去交错)若要启用软体去交错,可以选择YADIF,此处的去交错与madVR內的去交错,则一使用即可

基本上到这里,LAV+Xysubfilt配置指南就完成的差不多了,其实看似复杂,很多东西保持默认就没有什么问题,只要potplayer成功加载上这些插件,就已经非常强大了。下一篇我们来配置potplayer的最重要的插件–madVR。

本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com

点赞 0
收藏 0

文章为作者独立观点不代本网立场,未经允许不得转载。