Программа поиска документов-дубликатов
Дописываю на Ruby программу, сканирующую имена электронных книг и выдающую потенциальные дубликаты. Понадобилась, чтобы слить свою коллекцию с похожей от друга.
Дубликатами считаются файлы, в именах которых "много" одинаковых слов - поэтому находятся дубликаты для книги в разных форматах (djvu / pdf/ chm).
Работает в командной строке.
Делаю интерфейс на Ruby-on-Rails. Наверно, зарелизю на rubyforge'е. Один мой проект там уже есть )
Дубликатами считаются файлы, в именах которых "много" одинаковых слов - поэтому находятся дубликаты для книги в разных форматах (djvu / pdf/ chm).
Работает в командной строке.
Делаю интерфейс на Ruby-on-Rails. Наверно, зарелизю на rubyforge'е. Один мой проект там уже есть )
