Всех с Новым Годом! :)
Необходимо создать список из максимально длинных общих фрагментов 2 строк. Например, есть 2 строки:
1: 'Дорогой жидкокристаллический монитор. Он может быть изготовлен'
2: 'Дорогой жидкокристаллический монитор, который может быть изготовлен'
Результат должен быть такой:
['Дорогой жидкокристаллический монитор','может быть изготовлен']
Желательно, чтобы фрагменты делились по словам.
Нашел на wiki такой код:
def longest_common_substring(s1, s2):
m = [[0] * (1 + len(s2)) for i in range(1 + len(s1))]
longest, x_longest = 0, 0
for x in range(1, 1 + len(s1)):
for y in range(1, 1 + len(s2)):
if s1[x - 1] == s2[y - 1]:
m[x][y] = m[x - 1][y - 1] + 1
if m[x][y] > longest:
longest = m[x][y]
x_longest = x
else:
m[x][y] = 0
return s1[x_longest - longest: x_longest]
Но он возвращает лишь одну самую длинную подстроку. Можно ли как-нибудь подстроить этот код под мою задачу, а то я что-то не соображаю? :)