LINUX.ORG.RU

[семантическая организация файлов]установка сходства между двумя файлами


0

1

что посоветуете?

нужно: нужна возможность ручной установки семантического сходства file1 и file2 и потом доступа к file2 через file1. Очень желательна возможность указать коэффициент сходства(например от 1 до 100%), и сортировать по нему. Желательно чтоб все было реализованно как можно глубже так чтоб file2 был доступен по пути file1/file2 так и по file1/file2/file1/file2 прямо из консоли.

то есть я указываю что file1 похож на file2, и потом получаю доступ к file2 через file1.



Последнее исправление: whiiteliites (всего исправлений: 2)
Ответ на: комментарий от fxpanda

сорри, не указал. Нужно сходство по содержанию. То есть я указываю что file1 похож на file2, и потом получаю доступ к file2 через file1.

whiiteliites
() автор топика

>возможность ... установки ... сходства file1 и file2

cmp, xdelta, bsdiff, diff

anon_666
()

То что тебе нужно называется hierarchical clustering. Однако так чтобы результаты были видны в виде файловой системы это умножение сущностей, т.е. не unix-way.

Раздели кластерный анализ и конкретную визуализацию результатов.

mclaudt
()

Вообще делается так: на оcновании выбранной метрики вычисляются расстояния между файлами, далее полученные расстояния на основании порогового фильтра кластеризуются в дискретную метрику, и на основании этой дискретной метрики создаются папки и симлинки.

mclaudt
()
Ответ на: комментарий от mclaudt

Подозреваю, что для текстовых файлов построение эдакого характеристического дерева займет очень много времени. ИМХО, определять степень схожести изображений куда как проще...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

Зависит от критериев похожести. На самом деле я сходу и не назову область, где полезно применить такое. Интересно в связи с чем у ТС возник вопрос.

mclaudt
()
Ответ на: комментарий от mclaudt

> Однако так чтобы результаты были видны в виде файловой системы это умножение сущностей, т.е. не unix-way.

Вполне юниксвейно запилить драйвер FUSE, отображающий иерархические отношения, полученные из результатов работы скрипта. Правда задача ТСа от этого не становится менее бредовой...

geekless ★★
()
Ответ на: комментарий от Eddy_Em

Очень просто. Автоматика пока вообще не может находить _семантические_ сходства. И ему нужен просто инструмент для облегчения ручной работы.

sin_a ★★★★★
()
Ответ на: комментарий от mclaudt

тобы нужный мне любой файл был доступен через другой.

пример: есть фотки которые кинул кудато на хард. позже куда-то переместил потом долго они мне были ненужны. Теперь их попробуй найди следи большого количества. Имена файлов то одинаковы почти. Но те фото как то опосредовано связаны с книгой. Ёе мне не представляет труда найти ибо я знаю автора. Потому если бы те фотки были доступны через эту книгу то я бы без труда нашёл. вот примерно так:

потому что держать в памяти связи между файлами легче, Чем помнить имена всех файлов.

whiiteliites
() автор топика
Ответ на: комментарий от sin_a

нужно чтоб связи между файлами были организованны так же как их содержание организованно у меня в памяти в голове. Потому автоматика вряд ли покатит

whiiteliites
() автор топика
Ответ на: комментарий от whiiteliites

>>file1/file2/file1/file2

связи между файлами были организованны так же как их содержание организованно у меня в памяти в голове.

0_o у тебя там замыкает где-то.

А вообще забей - ничего лучше тегов пока нету, но и теги ужасно неудобны.

mclaudt
()
Ответ на: комментарий от mclaudt

критерий похожест ести пусть будет один. о теги могут быть ввиде служебных файлов. это позволит их так же в путь встраивать. пример такой

музыка/Пилот - Сегодняшним днём.mp3/2007/ЗакатИюнь17.jpeg/Солнце/Солце уходит на запад.mp3

whiiteliites
() автор топика
Ответ на: комментарий от mclaudt

>>связи между файлами были организованны так же как их содержание организованно у меня в памяти в голове.

0_o у тебя там замыкает где-то.



у него все отлично. а у тебя нет фундаментального образования в CS.

возможно, очередные ускоренные курсы быдлокодеров

atiyakkha
()
Ответ на: комментарий от geekless

скорее сделаю чтото типа файлы+одноименные папки+папки-теги+хардлинки. После сессии что-нибудь придумаю. Да и мусорить в используемую систему пока не хочется.

whiiteliites
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.