Based on the published rsync algorithm (<a href="http://cs.anu.edu.au/techreports/1996/TR-CS-96-05.pdf">pdf</a>), it appears to filter definitely different blocks from possibly unchanged blocks using weak hashing, then applying strong hashing to double-check the rest of the file for true differences. MD4 and MD5 do experience collisions, so isn't rsync fast at the risk of being inaccurate? If I can prove that the strong algorithms rsync uses have collisions, can you prove that rsync avoids corner cases where a file block was changed but even the strong hash algorithm misses it?<div>
<br></div><div>Have recent versions of rsync considered using a more robust implementation of file change monitoring, like <a href="https://www.dropbox.com/help/8/en">Dropbox</a> does? It looks fast on my machine.<br clear="all">
<div><br></div>-- <br><div></div>Cheers,<div><br></div><div>Andrew Pennebaker</div><div><a href="http://www.yellosoft.us" target="_blank">www.yellosoft.us</a></div>
</div>