मान लीजिए कि मैं कुछ तार की एक सूची है, और वहाँ कुछ तार वहाँ है कि बहुत, बहुत समान हैं। और मैं उन को हटाना चाहते लगभग डुप्लिकेट । कि के लिए, मैं निम्नलिखित कोड के साथ आया था:
from difflib import SequenceMatcher
l = ['Apple', 'Appel', 'Aple', 'Mango']
c = [l[0]]
for i in l:
count = 0
for j in c:
if SequenceMatcher(None, i, j).ratio() < 0.7:
count += 1
if count == len(c):
c.append(i)
कौन सा अच्छा काम करने के लिए लगता है, लेकिन मैं वास्तव में नेस्टेड छोरों पसंद नहीं है और यह भी इस count
समाधान बदसूरत लग रहा है। लेकिन शायद यह एक अधिक pythonic रास्ते में उसे लिख करने के लिए संभव है? जनरेटर का उपयोग करना, हो सकता है हो सकता है?
धन्यवाद एक संकेत के लिए आभारी होंगे :)