விக்கிமூலம்:பைத்தான்3நிரல்கள்/இருபக்கங்களில் பிரிந்த சொல்லிணைப்பு

விக்கிமூலம் இல் இருந்து
Jump to navigation Jump to search
# -*- coding: utf-8 -*- 
# target: to place the templates ({{tl|hws}} and {{tl|hwe}}) in respective pages with the help : https://ta.wikisource.org/s/9az9 
## example: https://ta.wikisource.org/w/index.php?title=%E0%AE%AA%E0%AE%95%E0%AF%8D%E0%AE%95%E0%AE%AE%E0%AF%8D:%E0%AE%A4%E0%AE%AE%E0%AE%BF%E0%AE%B4%E0%AF%8D%E0%AE%A4%E0%AF%8D_%E0%AE%A4%E0%AE%BE%E0%AE%A4%E0%AF%8D%E0%AE%A4%E0%AE%BE_%E0%AE%89._%E0%AE%B5%E0%AF%87._%E0%AE%9A%E0%AE%BE%E0%AE%AE%E0%AE%BF%E0%AE%A8%E0%AE%BE%E0%AE%A4_%E0%AE%90%E0%AE%AF%E0%AE%B0%E0%AF%8D.pdf/69&curid=83025&diff=1282660&oldid=1253183
# to do :மேற்கோள் வரும் பக்கங்களில் இது போன்ற வழுவை வராமல் பார்த்துக் கொள்ளவேண்டும். https://ta.wikisource.org/w/index.php?title=%E0%AE%AA%E0%AE%95%E0%AF%8D%E0%AE%95%E0%AE%AE%E0%AF%8D:%E0%AE%AE%E0%AF%81%E0%AE%A4%E0%AE%B1%E0%AF%8D_%E0%AE%95%E0%AF%81%E0%AE%B2%E0%AF%8B%E0%AE%A4%E0%AF%8D%E0%AE%A4%E0%AF%81%E0%AE%99%E0%AF%8D%E0%AE%95_%E0%AE%9A%E0%AF%8B%E0%AE%B4%E0%AE%A9%E0%AF%8D.djvu/45&diff=prev&oldid=1233751
# சொல் இடைவெளி குறித்து :
# fix bug for பக்கம்:இளையர் அறிவியல் களஞ்சியம்.pdf/231 ‎ + {{hwe|{{Css|தன்{{Css}} 

import csv, time, subprocess, re, pywikibot
# விளைவிடு = print
with open('000.csv','r') as உருவானகோப்பு:
	படிப்பான் = csv.reader(உருவானகோப்பு)
	#வரி = next(படிப்பான்)  ## முதல் வரியை நீக்கிப் படிக்கும்.
	## ஒவ்வொரு வரியாகப் படிக்கிறேன்
	## ஒவ்வொரு வரியாகப் படிக்கும்போது, அதற்கு வரிசையெண் இடுகிறேன்.
	for வரி in படிப்பான்:
		subprocess.call("sed -i `` 1d 000.csv",shell=True) 
		முசொதொப = வரி[0] 
	
		முசொதொபஎண் = முசொதொப.split('/')[-1] # முறிந்தசொல்தொடக்கப்பக்கம் = முசொதொப
		முசொதொபஎண்மறை = முசொதொப.split('/')[0] # முறிந்தசொல்முடிவுப்பக்கஎண் = முசொமுப 
		print(' சொற்களை இணைக்க எடுத்துக் கொள்ளும் பக்கங்கள்;—\n ..........................................')
		print(முசொதொப)
		முசொமுபஎண் = int(முசொதொபஎண்) + 1
		நூலின்பெயர் = முசொதொப.replace('பக்கம்:','').replace('.pdf/','').replace(முசொதொபஎண்,'')
		முசொமுப = முசொதொபஎண்மறை + '/' + str(முசொமுபஎண்)
		print(முசொமுப)
		
		இணையதளம் = pywikibot.Site('ta', 'wikisource')
		தொடக்கப்பக்கம் = pywikibot.Page(இணையதளம்,முசொதொப)
		முடிவுப்பக்கம்   = pywikibot.Page(இணையதளம்,முசொமுப)
		முசொதொபமுழுத்தரவு = தொடக்கப்பக்கம்.text
		முசொமுபமுழுத்தரவு = முடிவுப்பக்கம்.text
		தேடுகுறிமுறை = re.compile("\<noinclude\>.*?\<\/noinclude>", re.DOTALL)
		முசொதொபகுறிச்சொற்கள் = re.findall(தேடுகுறிமுறை, முசொதொபமுழுத்தரவு)
		முசொமுபகுறிச்சொற்கள் = re.findall(தேடுகுறிமுறை, முசொமுபமுழுத்தரவு)
		முசொதொபநடுப்பகுதித்தரவு = re.sub(தேடுகுறிமுறை, '', முசொதொபமுழுத்தரவு).strip()
		முசொதொபநடுப்பகுதிச்சொல் = முசொதொபநடுப்பகுதித்தரவு.split(' ')[-1]
		print("தற்போதுள்ள முசொதொபநடுப்பகுதிச்சொல் →→→→→→ " + முசொதொபநடுப்பகுதிச்சொல் + '  (' + str(முசொதொபஎண்) + ')'+'\n')
		முசொமுபநடுப்பகுதித்தரவு = re.sub(தேடுகுறிமுறை, '', முசொமுபமுழுத்தரவு).strip()
		முசொமுபநடுப்பகுதிச்சொல் = முசொமுபநடுப்பகுதித்தரவு.split(' ')[0]
		print("தற்போதுள்ள முசொமுபநடுப்பகுதிச்சொல் →→→→→→ " + முசொமுபநடுப்பகுதிச்சொல் + ' (' + str(முசொமுபஎண்) + ')'+'\n')
		
		if 'hws' in முசொதொபநடுப்பகுதிச்சொல் or 'hyph' in முசொதொபநடுப்பகுதிச்சொல் in முசொதொபநடுப்பகுதிச்சொல் or 'start' in முசொதொபநடுப்பகுதிச்சொல்:
			print('முசொதொபக்கத்தில் ஏற்கனவே,  ''({{hws|)''  என்ற வார்ப்புரு உள்ளது.')
			முசொதொபநடுப்பகுதிச்சொல்சுத்தம்1 = முசொதொபநடுப்பகுதிச்சொல்.split('|')[-2]
			print('துப்புரவான முசொதொபநடுப்பகுதிச்சொல் →→→→→→ ' + str(முசொதொபநடுப்பகுதிச்சொல்சுத்தம்1)+'\n')
			இணைந்தமுழுச்சொல் = முசொதொபநடுப்பகுதிச்சொல்சுத்தம்1 + முசொமுபநடுப்பகுதிச்சொல்
			print("இணைந்தமுழுச்சொல் →→→→→→ " + இணைந்தமுழுச்சொல் +'\n')
			
			இரண்டாம்வார்ப்புருவுடன் = '{{hwe|' + முசொமுபநடுப்பகுதிச்சொல் + '|' + இணைந்தமுழுச்சொல் + '}}'
			print("இணைந்தமுழுச்சொல்-இரண்டாம்வார்ப்புருவுடன் →→→→→→ " + இரண்டாம்வார்ப்புருவுடன் +'\n')
			if 'hwe' in முசொமுபநடுப்பகுதிச்சொல் or 'hyph' in முசொமுபநடுப்பகுதிச்சொல் in முசொமுபநடுப்பகுதிச்சொல் or 'end' in முசொமுபநடுப்பகுதிச்சொல்:
				print('முசொமுபக்கத்தில் ஏற்கனவே,  ''({{hwe|)''  என்ற வார்ப்புரு உள்ளது.')
				
			else:
				print('முசொமுபக்கத்தில் ஏற்கனவே,  ''({{hwe|)''  என்ற வார்ப்புரு  இல்லை.')
				அம்முடிவுப்பக்கத்தில்மாற்றம் = முசொமுபமுழுத்தரவு.replace(முசொமுபநடுப்பகுதிச்சொல்.replace('-',''), இரண்டாம்வார்ப்புருவுடன், 1)
				முடிவுப்பக்கம்.text = அம்முடிவுப்பக்கத்தில்மாற்றம்
				முடிவுப்பக்கம்.save(summary='+ ' + இரண்டாம்வார்ப்புருவுடன்.replace('-',''))
		else:
			print('முசொதொபக்கத்தில் ஏற்கனவே,  ''({{hws|)''  என்ற வார்ப்புரு இல்லை.')
			இணைந்தமுழுச்சொல் = (முசொதொபநடுப்பகுதிச்சொல் + முசொமுபநடுப்பகுதிச்சொல்).replace('-','')
			இணைந்தமுழுச்சொல்2 = இணைந்தமுழுச்சொல்.split('<')[0]           
			print("இணைந்தமுழுச்சொல் →→→→→→ " + str(இணைந்தமுழுச்சொல்2) +'\n')
			முதற்வார்ப்புருவுடன் = '{{hws|hyph=|' + முசொதொபநடுப்பகுதிச்சொல்.replace('-','') + '|' + str(இணைந்தமுழுச்சொல்2) + '}}'
			print("இணைந்தமுழுச்சொல்-முதற்வார்ப்புருவுடன் →→→→→→ " + முதற்வார்ப்புருவுடன்+'\n')
			print('சேமிக்கப்படவுள்ள தொடக்கப்பக்கத்தின், நடுப்பகுதி மாற்றத்துடனனான, தொடக்கப்பக்க முழுத்தரவு ;—\n-------------------------------------------------------------------------------\n')
			அத்தொடக்கப்பக்கத்தில்மாற்றம்குறி = முதற்வார்ப்புருவுடன்.join(முசொதொபமுழுத்தரவு.rsplit(முசொதொபநடுப்பகுதிச்சொல், 1))
			தொடக்கப்பக்கம்.text = அத்தொடக்கப்பக்கத்தில்மாற்றம்குறி
			தொடக்கப்பக்கம்.save(summary='+ ' + முதற்வார்ப்புருவுடன்.replace('-',''))
			if 'hwe' in முசொமுபநடுப்பகுதிச்சொல் or 'hyph' in முசொமுபநடுப்பகுதிச்சொல் in முசொமுபநடுப்பகுதிச்சொல் or 'end' in முசொமுபநடுப்பகுதிச்சொல்:
				print('முடிவுப்பக்கத்தில் ''({{hwe|)''  என்ற வார்ப்புரு உள்ளது.')
			else:
				print('முடிவுப்பக்கத்தில்  ''({{hwe|)''  என்ற வார்ப்புரு இல்லை.')
				time.sleep(15)
				இரண்டாம்வார்ப்புருவுடன் = '{{hwe|' + முசொமுபநடுப்பகுதிச்சொல்.replace('-','').replace('<ref>','') + '|' + str(இணைந்தமுழுச்சொல்2) + '}}'
				அம்முடிவுப்பக்கத்தில்மாற்றம் = முசொமுபமுழுத்தரவு.replace(முசொமுபநடுப்பகுதிச்சொல், இரண்டாம்வார்ப்புருவுடன், 1)
				முடிவுப்பக்கம்.text = அம்முடிவுப்பக்கத்தில்மாற்றம்
				முடிவுப்பக்கம்.save(summary='+ ' + இரண்டாம்வார்ப்புருவுடன்.replace('-',''))