软件项目交易网
27人浏览/6人投稿
8小时前
待托管赏金
第一步操作选择目录加入主目录列表或者排除目录列表。
所添加的目录不能是其他目录的下级目录。例如列表里有A,不允许添加A/../B。
用户可以选择二进制相同分组,或图文相同分组或者双层分组三者之一。
如果查找的是二进制相同,查找完成后显示就显示列表让人预览,在主目录列表
的目录之下,同一组文件二进制相同,二进制相同的全部文件构成一组,每个组不包含和同组文件二进制不同的文件。不同组的文件二进制不同。主目录目录列表所包含的目录之下的文件,采用二进制相同的全部文件构成一组的方式,全部文件能够构成的全部组都找出来。要求逐字节比较,不要比较哈希。
组n(n是序数,从开始第几个)
路径1保留或删除,
......
路径k保留或删除
功能选项1 选择A所在的目录是主目录列表目录中最前面的一个,就显示,保留A,删除其他
如果选择的是图文影音相同
查找完成以后,显示列表让人预览
组n(n是某个整数,序数,图文相同的一组)
路径1 保留或删除
路径2 保留或删除
等等
用户可以选择以下二者其一
二进制相同也加入图文相同的组。
功能选项2 若干个文件可以格式不同图文相同或影音相同,其中A是主目录列表最前面的目录里尺寸最小的一个,用户可以选择保留A,删除其他。
功能选项3 若干个文件可以格式不同图文相同或影音相同,其中A是其中一个,A是尺寸最小的一个并且是所有相同尺寸在列表里最前面的,就显示保留A,删除其他。
如果选择的是双层分组
在主目录列表的目录之下的文件经过查找,划分为
第一层组里的文件都是图文相同
第二层组里的文件都是二进制相同,不同组的都是图文相同而不是二进制相同
组1 图文相同的一组
组1(下级) 二进制相同 路径1保留或删除
路径2保留或删除
等
组2(下级) 二进制相同 路径k保留或删除等
等等
下级不同组包含文件之间二进制不同,全部文件中二进制相同的全部文件都归到了一组
全部文件中图文相同的文件都归为了一组。上级组不同组的文件图文不同。
下级组包含不同的文件的路径
用户可以选择以下二者其一
4若干个文件可以格式不同图文相同或影音相同,其中A是主目录列表最前面的目录里尺寸最小的一个,用户可以选择保留A,删除其他。
5若干个文件可以格式不同图文相同或影音相同,其中A是其中一个,A是尺寸最小的一个并且是所有相同尺寸在列表里最前面的,就显示保留A,删除其他。
确认删除,就保留每组里面显示保留的,删除之前显示删除的文件。
对于每个文件如果这个文件没有其他文件和它相同就保留。
文件类型:
jpeg pdf tiff png bmp avi mp3 mp4 djvu wav mkv mpeg mpg mov rmvb gif raw wmv svg
要求:不同格式的图片,电子书,视频文件,音频文件相同清晰度,还原度互相比较,相同的保留一个。如何选择保留和删除和4或者5相同。
音频就比较声音波形。图片就比较每个像素。视频就比较每个帧。如果是图文相同,就看文件的显示效果,图像是否相同。还可以逐字节比较,不用计算哈希。
比较图文或者影音是否相同可以是相同清晰度,保真度不同格式的文件之间的。
找出损坏的图片 影片 声音 文档,并且在出错信息中显示。损坏文件不和别的文件比较图文影音,只比较二进制。
图文比较如果能确定文字编码类型,再比较文本和字符。否则只比较二进制。文件中含有的文件名中的文字有错误编码的不合法字符编码类型相同,要排除错误。
功能:可以排除目录,排除目录底下的文件不能删除。
功能选项:可以在排除目录基础上增加功能。其他目录和排除目录的文件相同,就删除其他目录里面的。
功能选项:估计出查找完成多少文件的时间。能够随时停止,专门一栏显示出哪些目录里面的文件都两两比较过。显示重复文件的列表然后让人决定,确认是否删除。
要求:专门一栏显示重复文件,哪些应该删除或保留,专门一栏显示单独文件,专门一栏暂停时显示出哪些目录里面的文件两两比较过。专门一栏显示出错信息。
要求小文件多,硬盘读写速度容易慢,要求处理速度要尽可能的快
平台:Windows 或linux 个人电脑 指令集x86_64 单核或者多核
要求程序结果正确,内存消耗不超过可用内存,尽可能快。
我要的程序是直接在机器上运行的二进制文件,依赖的运行也要尽可能快。用效率高的语言编写,例如C
====
同步
目录a和b
一个文件a里面有b里面也有,包括图文重复、影音重复,就什么动作都不做
一个文件a里面有b里面没有,就复制到b\a_sync_to_b。如果b\a_sync_to_b里面有重名文件,就在底下新建目录,然后复制进去。
一个文件a或者b里面有多份,就保留一份。包括二进制相同,影音相同,图文相同。影音相同图文相同就保留尺寸最小的一份。
排除目录不动。
=====
有目录列表A和B
将列表A底下的文件,随机抽样复制到B底下的不同目录,并且随机重命名