1235.gif

布丁布丁布

GF  2023-02-03 05:32
(buding111)

【技术分享】 用好Calibre,史上最强的一站式本子管理(附懒人包)part.2

23.5.6更新:
引用
1、首先是补档了一下网盘链接,补充了tag的中文数据库,自己在插件里填一下就行。
2、lanraragi那边有国人制作了直接刮取中文tag和转换中文tag的插件,所以不需要再使用calibre进行刮削了。但是可以利用calibre的整理方式,来使下载的本子标准化命名,方便那边的插件刮削。插件地址如下
复制代码
  1. https://github.com/zhy201810576/ETagConverter

前言

刚好最近研究本子管理也有些心得,这里分享一下。
我自己用过的漫画管理软件有Calibre、Lanraragi、komga、ubooquity、happypandax等等,下面就根据我个人的使用体验来一一说明吧。



本篇是漫画管理的第二篇,第一篇介绍lanraragi的晚点再上传,今天先介绍怎么整理

顺带补充一下:本篇内容最重要的就是使用calibre完成一个系统的本子库,即本子的存放路径为本子库/作者名/本子。同时这种存放方式也不会影响其他软件读取,例如lanraragi或者是大多数人用的yacreader。而在设置好以后,每次导入只用将calibre打开,本子会自动复制一份到对应作者的文件夹中,以完成整理的目的。

二、Calibre

官网地址:https://calibre-ebook.com/
支持平台:linux、windows


作为最知名的电子书管理软件,想必只要有管理本子需求的人查询资料的时候都看到过这个软件,但是这个软件的颜值和使用方法却使很多人望而却步,但是只要上手了以后,这个软件确实不愧是“最强电子书管理软件”


特色功能:
①最强的元数据管理


除了能够直接手动调整外,还可以通过插件直接获取元数据,并且这个插件是可以在刮取过程中手动调整的,最重要的是插件获取的tag会参照数据库实时翻译。插件的获取速度也是比较快的,可以参见下面这个gif。


这个插件的地址是https://github.com/nonpricklycactus/Ehentai_metadata
使用方法也可以参见官方的说明,我下面放出的懒人包里也会包含这个插件。



②自带网络浏览库的功能



可以直接在线观看存好的本子或是轻小说,不过这个功能并不算好用。
但这个功能的缺点是,阅读时需要将整个文件缓存到本地,然后再打开阅读,如果本身是epub这类轻小说文件,那倒是无伤大雅。但对于动辄上百兆的本子来说,局域网环境尚且能用,公网环境那基本是用不了的,所以这一点就远不如lanraragi和komga好用了。





一些缺点:

那么谈完优点,那么这个软件有没有什么缺点呢,当然有而且还不少,但是大部分都可以解决的,我放出的懒人包也会解决其中的一些问题。

①自有数据库,需要将本子文件导入其中,如果想要再留一份原档的话,那就是双倍占用空间。同时导入会将文件名重命名为英文,万一数据库炸了就很难进行恢复了。(不过这个缺点本篇内容也会解决掉)


这个问题也是之前阻碍我使用这个软件最大的问题,不过经过一些大佬的共同努力,已经算是解决了,下面给出解决方案。
项目地址:https://github.com/kurikomoe/calibre-utf8-path
下载后进行覆盖软件的文件,并通过批处理文件启动文件,这样导入的文件就不会变为英文,并且不会影响软件的本身运行



通过这个方式改动后我发现虽然都会保留为中文,但是文件名却被裁剪了。并且文件的命名格式后面还会再加一个作者名字,这样就不太美观了。




解决办法也很简单,那就是接着修改calibre的文件命名代码就行了,打开上面下载的并覆盖到软件目录的文件,路径如下D:\Program Files\Calibre\src\calibre\db\backend.py,文件内搜索construct_path_name



然后将其中的部分内容进行修改,(这段代码老是乱我就发个文件了)

此帖售价 0 SP币,已有 225 人购买
若发现会员采用欺骗的方法获取财富,请立刻举报,我们会对会员处以2-N倍的罚金,严重者封掉ID!


这样修改后的效果如下


上面提到的Lanraragi是根据文件夹内部的压缩格式的文件进行检索的,因此这样命名就不会影响Lanraragi的使用了。并且以这样修改后,Calibre的数据库刚好就是以作者命名的整理好的文件夹,即便是数据库炸了也不妨碍使用(不过最好还是做好备份)




导入时去除作者名字这一点可以通过正则表达式来去除。打开软件——首选项——添加书籍填入以下表达式即可

[pre](?P<comments>(\((?P<series>[^\(\)]*)\)).*?\[(?P<author>(?:(?!汉化|漢化|CE家族|天鵝之戀)[^\[\]])*)\](?:\s*(?:\[[^\(\)]+\]|\([^\[\]\(\)]+\))\s*)*(?P<title>[^\[\]\(\)]+)?\s?(\[(?P<publisher>[^\]]*(化|社|組))\])?.*)[/pre]
一般来说经过这个正则表达式过滤的本子都可以直接通过插件来获取元数据,少部分的需要手动一下,我个人刮了几千本,大概比例在2%以下。





插件使用

标签映射器

插件获取的标签大多为女性:黑丝,这种类型的,如果想要批量解决这个问题的话需要使用标签映射器。



这个自带的工具可以将获取的标签直接进行替换,这样看上去就会整洁很多。这个工具默认不会在工具栏出现,需要在设置中调出来


元数据刮取的插件的设置界面可以直接导入制作好的规则

这样设置好以后刮取的数据就是直接转换好的,我的懒人包里面插件的规则是少一个移除女性标签的规则的,因为万一有新的tag出现就不会被插件去掉。可以再往规则列表里增加内容


②重复文件检索插件
该插件可以根据多种条件来匹配重复文件,大多数使用的情况就是匹配本子名字,能够大大降低查重的工作量。

当然有时候一些本子命名本身就相似,比如名字只有第几话命名的,也会被列入其中,这时可以通过工具右侧的小箭头将他们剔除。


③本子元数据写入插件

点一下就写进去了,很简单吧。



展示环节



检索起来就是极其方便的,应该是本子管理的终点了。然后懒人包里还包含两个插件,一个是可以将calibre刮取到的元数据直接写入压缩包供其他软件读取,只要未来lanraragi跟进了,那基本就是完全体了。还有一个是用来查重的,有什么作用我就不用多说了吧。
其实还有些问题没有提到的,但是这都奔着6000字去了,这个就啥时候有空了下次在写吧,有啥问题下面问就好了。





一些未解决的问题:

1、lanraragi目前还无法读取压缩包内的注释和xml文件,不过这部分已经提交作者了,希望未来能更新出来吧。

2、使用中文本地保存的话,calibre自带的在线服务端没办法看到封面,这点也很容易解决,因为有个界面更好的calibre-web,有需求的人自己去折腾一下吧。是可以直接用同一个数据库的,但注意不用两边同时操作数据库。




总结

总结一下,在经过修改以后,calibre可以自动将之前杂乱的本子标准化进行存储,并且源文件的命名也不会有影响,搭配lanraragi进行在线观看,基本上就是最完善的管理流程了。



参考资料

使用Calibre管理你的本子——第二季
使用Calibre管理你的本子



↓懒人包↓


此帖售价 0 SP币,已有 225 人购买
若发现会员采用欺骗的方法获取财富,请立刻举报,我们会对会员处以2-N倍的罚金,严重者封掉ID!



碎碎念time:
明天有空的话会录个整理流程的视频,顺带吐槽下南+的编辑器真难用          ,本文本来首发在仓库那边,但是审核鸽了我两天就先发过来了。有啥问题下面问就好了,我这两天会高强度看论坛的。

1683261.jpg

hakiknaka

图片显示,“防盗链”,无法查看,还是说我姿势不对?

5.gif

hcpekla

B2F  2023-02-03 05:38
(我想要朝批)
感觉不错,马个克

976105.png

happk

B3F  2023-02-03 05:45
(happk)
换个图床吧...

Calibre 虽然全能,但UI好难看啊

1235.gif

布丁布丁布

B4F  2023-02-03 06:00
(buding111)

回 1楼(hakiknaka) 的帖子

我在调了,南+这编辑器好难用,我是在石墨上写完了搬过来的

1235.gif

布丁布丁布

B5F  2023-02-03 06:01
(buding111)

回 3楼(happk) 的帖子

这个其实无所谓,因为用的时候是不开calibre的嘿嘿,一般用lanraragi来看,calibre只是用来刮tag和管理而已

GHOSTGG


172822.jpg

pluame

B7F  2023-02-03 06:12
(http://vip.jiachengweb.com/delivery/VIP200vzc2Ntixhttp://2377ck.cc/vodplay/27599-1-1.html)
74474

none.gif

bd47603f

用来试试 感谢楼主

1368512.jpg

极光月

之前用kindle看epub电子书之类的時候用过一段时间这软件当浏览器
界面ui太丑了,并且也很不爽它这个很弱智的数据库设计,自己保存一份就算了,还会把文件名变成拼音

1235.gif

布丁布丁布

B10F  2023-02-03 06:57
(buding111)

回 9楼(极光月) 的帖子

我现在就是解决他变拼音的问题啊,解决这个问题以后这软件除了界面丑了点那就没有缺点了。
保存下来的数据库刚好就是以作者分类的整理好的文件夹,刚好可以直接用,用everything检索也没有问题。

1235.gif

布丁布丁布

B11F  2023-02-03 06:57
(buding111)

回 9楼(极光月) 的帖子

然后数据库保存的文件也是原来的标题,就没有太大影响了

705898.jpg

拙计者沙利叶

B12F  2023-02-03 07:17
(然而并没有什么卵用)
  我都是手动分类标题的 不过之前不知道如何刮取tag,先谢谢LZ了
(不过好久没整理了,没时间,叹气

我自己大概会弄成这样



之前还有个自己写整理软件的老哥,不知道现在怎么样了

HARD


1235.gif

布丁布丁布

B14F  2023-02-03 14:15
(buding111)
引用
引用第12楼11d18ef8于2023-02-03 07:17发表的  :
  我都是手动分类标题的 不过之前不知道如何刮取tag,先谢谢LZ了
(不过好久没整理了,没时间,叹气

我自己大概会弄成这样

.......


你点逐个修改元数据,下面下载元数据旁边有个工具图标,点进去填一下e站的账号信息,然后就可以用插件刮削了

1072696.jpg

Cheems

B15F  2023-02-03 16:22
(Erotic only, not porn。[sell=0]出售內容[/sell])
一百昏

gbhrfi.webp

iiiloveU

本身就有分类习惯,不喜欢这软件的书库还要多占一份空间。怎么直接用源路径呢?

1235.gif

布丁布丁布

B17F  2023-02-03 16:51
(buding111)
引用
引用第16楼8c1d52ec于2023-02-03 16:39发表的  :
本身就有分类习惯,不喜欢这软件的书库还要多占一份空间。怎么直接用源路径呢?

那这个没办法,calibre本身就是会自己维护自己的数据库的,我现在这么改动也只是能够将其数据库变为正常的样子。
你的需求貌似只能用komga或者lanraragi这些不会破坏本地路径的软件了。

梦之灵


瑞吞


@e


gbhrfi.webp

iiiloveU

引用
引用第17楼823d8567于2023-02-03 16:51发表的  :

那这个没办法,calibre本身就是会自己维护自己的数据库的,我现在这么改动也只是能够将其数据库变为正常的样子。
你的需求貌似只能用komga或者lanraragi这些不会破坏本地路径的软件了。

目前就exhentai-manga-manager最符合我需求,直接用的源文件路径和够轻便,成贤后不用管那么多杂七杂八的服务

3.gif

天之叢云

那我以前用calibre整理的1w多本本子是不是不能改成中文名字了

9.png

ba775247

辛苦了

1235.gif

布丁布丁布

B24F  2023-02-03 19:35
(buding111)
引用
引用第22楼5f7dba03于2023-02-03 19:01发表的  :
那我以前用calibre整理的1w多本本子是不是不能改成中文名字了

可以的,你先用我这个方式覆盖进去以后,先选几个本子批量更改然后上面用搜索替换,里面搜索12345,替换12345,用来触发一下本地存档机制,就可以换成中文啦

坂本阳一


3.gif

天之叢云

回 24楼(823d8567) 的帖子

楼主,问下关于代码去作者名字那块,好像不管用的样子,还有个是关于{先选几个本子批量更改然后上面用搜索替换},不清楚是怎么更改,我直接在文件夹里进行修改吗
还有个事,作者命名的表达式好像出了点问题,不识别了,我换成上一期的表达式就好了

1235.gif

布丁布丁布

B27F  2023-02-03 20:00
(buding111)

回 26楼(天之叢云) 的帖子

就是先随便选两三个本子,然后批量更改元数据,上面的标签选搜索替换,然后有载入搜索规则的,里面有个123,直接用一次,然后再回去看看那几个文件的存储命名是不是改了

1235.gif

布丁布丁布

B28F  2023-02-03 20:02
(buding111)

回 26楼(天之叢云) 的帖子

这一步操作在我文章里汉化那块的github上有详细讲述,其实也就是为了触发calibre的文件存储函数,随便替换一个相同的字符就行了,比如123换123,456换456,目的就是不在更改名字的情况下触发一下存储。
我自己1w多本都转化完成了没有问题,不过一次量大的话过程中可能会有几个报错,个人建议1000本一次慢慢搞

3.gif

天之叢云

回 28楼(823d8567) 的帖子

OK,没问题了,感谢大大

none.gif

antiworld

mmmmmmmmark