import docx
doc = docx.Document('/Users/apple/Desktop/پایا ن خوب.docx')
mp=dict()
for para in doc.paragraphs:
s=para.text
alphanumeric_filter = filter(lambda x: str.isalnum(x) or x==' ', s)
alphanumeric_string = "".join(alphanumeric_filter)
t=alphanumeric_string.split(' ')
for k in t:
if k in mp.keys():
mp[k]+=1
else:
mp[k]=1
# print (alphanumeric_string)
surted= dict(sorted(mp.items(), key=lambda item: -item[1]))
print('len is %i'%len(surted))
n=0
for f in surted:
print (f,surted[f])
n+=1
if n>100:
break
bash برای rename کردن زیرنویس ها
mp ,alphanumeric ,k ,in ,surted ,filter ,alphanumeric string ,1 print ,alphanumeric filter ,k in ,mp k
درباره این سایت