【小姐姐们的家放网上】智能化观看_持续更新
导读
本帖为开发直播贴,会经常更新开发进度。但不会发布教程工就娆教程工具会在新帖放出(PS:如果违反版规请删帖,谢谢管理大大)
当前进度:技术路线4:正在清洗数据+替换sqlite中的标题技术路线2:已发布第一版可用工具和教程 点这里
更新2:有福娃推荐了Jvideo,在此基础上可以有一个新的技术路贤妯20210907)
更新:想出了一个新的技术路贤妯20210906)
小姐姐们越来越多,该怎么给小姐姐们安一个家呢?去年在隔壁论坛和隔壁论坛,有人分享了艾薇_Data_Capture+Emby的解决方案,后续也有人分享过类似的方案,只不过刮削器和管理器不同而已。
(PS:艾薇_Data_Capture还在更新,想本地整理小姐姐的可以试试)
总的来说,需要两步:
1、使用正则表达式统一命名
2、根据名称去各大图书馆网站上获取视频封面,演员,时间,导演等元数据,并生成大图、小图和.info文件
3、将视频和数据导入媒体管理器中
最终效果类似于这样,不过影片都是小姐姐:
我部署使用后,发现还是有些问题:
1、刮削器无法匹配素人作品,造成许多素人只有一部,无法和正主合并(可能是之前的数据问题)
2、刮削器没有标题翻译功能,只有机械电脑翻译。真的,有些电影即使是中字的,没有标题的帮助,大部分人也不会一点一点去看剧情,因此准确的标题+无字幕的实用性是大过没有标题+中字的。
3、没有自主评分功能,不能对影片进行评级标记,不能修改影片的标签
4、媒体管理器大多数是采用本地服务器的方式,因此点击到打开中间的延迟比较高
技术路线1:对此,我的解决方案是:
1、自己爬取数据,并针对性进行整理
2、爬取某堂的中文区标题,匹配相应电影
2、在本地写一个web服务,使用浏览器进行观看和评分
之前一直拖着没整,最近想开始搞了,但在使用某站点的时候却发现一个问题:
按照我之前的解决方案,我能得到的是:很多电影的元数据+和骟的前端页面(可能相当于十年前的那种)+翻译好的标题+正确的数据+电影评级+修改标签+便捷选择和播放电影我需要付出的是:写BUG爬数据,并每天启动来更新数据+写网络服务+写各种附加功能
技术路线2:但这个站点其实已经包含了很多内容,电影的封面,元数据都有,只是不提供在线播放而已,那我如果只是写一个油猴脚本在网页上加一个按钮,那我能够得到:很多不断更新的电影的元数据+挺漂亮的前端+没翻译好的标题+无法私人评级+无法修改标签+便捷选择和播放电影。我需要付出的是只写一个油猴脚本
管理的最终目的是什么?当然是用来看的呀!而且既然能写油猴脚本,那缺少的翻译,评级和添加标签功能也可以通过脚本将相关数据转发给本地服务来实现。
(20210906更新)技术路线3:db+脚本的缺点是:当你的本地的电影不够多时,经常会遇到无法播放的问题,根源就在于db网站收录的是全部的电影,而你下载的电影可能就只有其中的一小部分,因而有了:
1、手动爬取元数据和某堂的翻译,并刮削封面
2、导入emby或jellyfin
3、编写油猴脚本实现评分+编辑标签
(先完善一下路线2的第一个版本,路线2的第二个版本和路线3是通用的,只是前端按钮的位置需要改一下而已)
(20210907更新)技术路线4:福娃@少年游推荐了软件Jvideo,能实现自动匹配,自主添加标签,自主评分,非常强大。根据我的需求,就只剩下中字标题这一个了,于是,我只需要做的是:
爬某堂高清中字区的电影标题:已完成,正在清洗数据
对于Jvideo的sqlite文件,一一查找是否有中字标题,若有则替换:已学会用gormC作sqlite文件,但还未在真实数据上进行C作,且本机数据太少,可能测不出什么bug
说干就干,立帖为证,需要解决/学习的功能点如下:
对于路线2来说:
前置条件:
下一堆小姐姐的电影:未完成
将刮削器的重命名模块提取出来,实现批量化重命名:未完成
完成基本的点击播放功能,到达可用状态:
网页调起本地应用程序并传递参数:已经实现网页调起本地应用功能,但传参时出现问题,拟通过本地exe文件清理参数后传递给potplayer(20210905_18:00更新:已完成)
复习JS语法:已完成本阶段需要的工作
学习油猴脚本的编写:已完成本阶段需要的工作
针对db站,添加播放按钮:已完成,但图标有点丑,需按照网站匹配图标样式
完成后将发布脚本,本地exe和使用教程:已发布工具
当前改进方向
修改播放图标样式
增加更多常见视频后缀名
增加对于中字和破解视频的识别功能
其他待添加功能
路线2和路线3的附加功能:
解决js跨域问题,并将本地exe文件改成本地服务,将URI协议改成TCP协议
点击播放后若视频文件不存在,自动复制网页的磁链,提交下载器下载
自主评分
标题翻译
添加标签
路线2,3和路线4的进阶功能:
搜集足够评分数据后:
预测未评分数据,并使用元数据(不包括图片)不断学习
进一步提升推荐能力,将图片数据加入训练数据(这个功能需要爬一堆数据,吃硬盘空间)
针对近日的新电影,自动预测评分,针对超过预制阈值的高分电影自动提交下载(实现智能化生活!)