விக்கிமூலம்:பைத்தான்3நிரல்கள்/நூற்த்துணைப்பக்க உருவாக்கல்

விக்கிமூலம் இல் இருந்து
Jump to navigation Jump to search
import csv, os, sys, shutil, pathlib, subprocess, re, time, pywikibot

##இந்நிரலானது மெய்ப்புக்கண்ட பொருளடக்கப் பக்கத்திலுள்ள  ஒவ்வொரு பக்கத்திற்கும், நூற்துணைப்பக்கங்களை, விக்கிமூலத்தில் உருவாக்கும்.

விளைவிடு = print

அந்நூலாசிரியர் = 'இராபர்ட்டு கால்டுவெல்'.strip()
விளைவிடு('தேவை-1:   இந்நூலாசிரியர் →→→→ ' + அந்நூலாசிரியர் + '\n') 
மொழிபெயர்ப்பாளர்1 = 'உள்ளீட்டு நூற்த்தொகுப்பு வார்ப்புருவில் எழுதியுள்ளேன்.'
விளைவிடு('தேவை-2: மொழிபெயர்ப்பாளர் →→→→ ' + மொழிபெயர்ப்பாளர்1 + '\n') 
# இதனை அட்டவணை கொண்டு உருவாக்க வேண்டும். அதன் ஒரு பக்கத்தினை எடுத்துக் கொண்டு, உரலியில் மின்னூலின் பக்கம் என்ன என்பதைப் பாருங்கள்.
# பிறகு அப்பக்கத்தில் அச்சாகியுள்ள நூலின் எண்ணைப் பாருங்கள். இரண்டுக்கும் உள்ள வேறுபாடு கீழுள்ள எண் ஆகும். 
பக்கயெண்வேறுபாடு = 19
விளைவிடு('தேவை-3 : பக்கயெண்வேறுபாடு →→→→ ' + str(பக்கயெண்வேறுபாடு) + '\n')
# மூலக்கோப்பு : விரிதாளின் ஐந்து columns உள்ளன. விவரம் :  
# நமக்கு அளிக்கப்பட்ட விரிதாள் கோப்பினை,  அணித்தரவுக்கோப்பாக மாற்றிக் கொண்டேன். காண்க: https://commons.wikimedia.org/w/index.php?title=File%3ATutorial-tamil-creation-csv-.webm
உள்ளீட்டுக்கோப்பு  = 'அணித்தரவுக்கோப்புத்தரவுகள்.csv'#  மறவாமல், இக்கோப்பின்முதல்வரியைத் தேவையில்லையெனில்  நீக்கிவிடவும்.
விளைவிடு('நிரலால் மாற்றமாகவுள்ள, விக்கி மூலக்கோப்பு = ' + உள்ளீட்டுக்கோப்பு + '\n')

#இதன் கீழுள்ள வரிகள், மூலக்கோப்பில் வெற்றுவரிகளைக் கண்டறிகிறது. பிறகு, மொத்த வரியெண்ணிக்கையைத்தரும்.	
with open(உள்ளீட்டுக்கோப்பு) as உள்ளீட்டுக்கோப்பு:
	படித்தல் = csv.reader(உள்ளீட்டுக்கோப்பு, delimiter='~',)
	உள்ளீட்டுக்கோப்புப்பட்டி = list(படித்தல்)
	def பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி):
		return sum(type(el)== type([]) for el in உள்ளீட்டுக்கோப்புப்பட்டி)
	உள்ளீட்டுக்கோப்புப்பட்டி2 = filter(None, உள்ளீட்டுக்கோப்புப்பட்டி)
	உள்ளீட்டுக்கோப்புப்பட்டி3 = list(உள்ளீட்டுக்கோப்புப்பட்டி2)
	def பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி3):
		return sum(type(el)== type([]) for el in உள்ளீட்டுக்கோப்புப்பட்டி3)
		
#வெற்றுவரிகள் நீக்கியத் தரவினைப்படிகிறேன்.
விளைவிடு(' இக்கோப்பிலுள்ள வெற்று வரிகளை நீக்கியபின், தரவுகளை மாற்றங்களுக்கு எடுக்கிறேன் ...\n')
விளைவிடு('   விரிதாளின் columnA, B, C, D, E, F என்பவை எடுத்துக்கொள்ளப்படுகின்றன ...\n')
# முனையத்தில் இறுதியாக தெரிவதற்காக , கீழுள்ள வரியெண்ணிக்கைகளைத் தருகிறேன்.			
emptyNum = பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி)-பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி3)
விளைவிடு('\n   இக்கோப்பிலுள்ள வெற்று வரிகளின் எண்ணிக்கை  =  ' + str(emptyNum))
விளைவிடு('   இக்கோப்பிலுள்ள தரவுள்ள வரிகளின் எண்ணிக்கை = ' + str(பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி3)))
விளைவிடு('   இக்கோப்பிலுள்ள மொத்த சொல்வரியெண்ணிக்கை = ' + str(பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி)) + '\n')
for வரிசையெண், வரித்தரவு in enumerate(உள்ளீட்டுக்கோப்புப்பட்டி3):	
	subprocess.call("sed -i `` 1d அணித்தரவுக்கோப்புத்தரவுகள்.csv",shell=True)
	#வரித்தரவு2= வரித்தரவு[1:]	# தரவிலுள்ள, cloumnA என்ற வரிசையெண்ணை நீக்குகிறேன்.
	உள்ளீட்டுக்கோப்புப்பட்டி3_strip = [item.strip() for item in வரித்தரவு] # ஒவ்வொரு வரியின் columnB,C,D ஆகியவற்றை strip செய்கிறேன்.
	உள்ளீட்டுக்கோப்புப்பட்டி3_strip_join = str(வரிசையெண்+1) + '. ' + str(உள்ளீட்டுக்கோப்புப்பட்டி3_strip) 
	உள்ளீட்டுக்கோப்புப்பட்டி3_strip_len = len(உள்ளீட்டுக்கோப்புப்பட்டி3_strip)

	if உள்ளீட்டுக்கோப்புப்பட்டி3_strip_len != 6 :
		விளைவிடு('   ஏதே ஒரு column இல்லை.' + உள்ளீட்டுக்கோப்புப்பட்டி3_strip_join) 
		time.sleep(3)
		
	elif உள்ளீட்டுக்கோப்புப்பட்டி3_strip_len == 6 :
		#விளைவிடு('   ' + உள்ளீட்டுக்கோப்புப்பட்டி3_strip_join)

		
		time.sleep(1)

		துணைப்பக்கப்பெயர் = உள்ளீட்டுக்கோப்புப்பட்டி3_strip[0] # விரிதாளின்படி,columnA, உருவாக்கவுள்ள நூற்த்துணைப்பக்கம்
		துணைப்பக்கப்பெயர்பிரி = துணைப்பக்கப்பெயர்.split('/')[0]
		அட்டவணைப்பெயர்சுத்தம் = str(துணைப்பக்கப்பெயர்பிரி).strip()
		துணைப்பக்கப்பெயர்பிரியெண்1மூன்றிலக்கம் = துணைப்பக்கப்பெயர்.split('/')[-1].split('-')[0]
		துணைப்பக்கப்பெயர்பிரியெண்1 = int(துணைப்பக்கப்பெயர்.split('/')[-1].split('-')[0])
		துணைப்பக்கப்பெயர்பிரியெண்2 = துணைப்பக்கப்பெயர்.split('/')[-1].split('-')[-1]
		முன்துணைப்பக்கயெண் = துணைப்பக்கப்பெயர்பிரியெண்1-1 
		முன்துணைப்பக்கயெண்மூன்றிலக்கம் = '0' + str(முன்துணைப்பக்கயெண்)
		முன்துணைப்பக்கயெண்மூன்றிலக்கம்கூட்டு = முன்துணைப்பக்கயெண்மூன்றிலக்கம் + '-' + துணைப்பக்கப்பெயர்பிரியெண்2
		பின்துணைப்பக்கயெண் = துணைப்பக்கப்பெயர்பிரியெண்1+1
		பின்துணைப்பக்கயெண்மூன்றிலக்கம் = '0' + str(பின்துணைப்பக்கயெண்)
		பின்துணைப்பக்கயெண்மூன்றிலக்கம்கூட்டு = பின்துணைப்பக்கயெண்மூன்றிலக்கம் + '-' + துணைப்பக்கப்பெயர்பிரியெண்2 
		முன்துணைப்பக்கத்தலைப்பு = உள்ளீட்டுக்கோப்புப்பட்டி3_strip[1] # விரிதாளின்படி,  columnB, முன்புள்ள தலைப்பு
		உருவாக்கும்தலைப்பு= உள்ளீட்டுக்கோப்புப்பட்டி3_strip[2] # விரிதாளின்படி,  columnC, உருவாக்கும் தலைப்பு
		பின்துணைப்பக்கத்தலைப்பு = உள்ளீட்டுக்கோப்புப்பட்டி3_strip[3] # விரிதாளின்படி, columnD, அடுத்தத்தலைப்பு
		உருவாக்கும்தலைப்புபக்கத்தொடக்கம் = உள்ளீட்டுக்கோப்புப்பட்டி3_strip[-2] # விரிதாளின்படி, columnE, தலைப்புத்தொடங்கும் பக்க எண்.
		உருவாக்கும்தலைப்புபக்கத்தொடக்கம்கூட்டெண் = int(உருவாக்கும்தலைப்புபக்கத்தொடக்கம்) + பக்கயெண்வேறுபாடு
		உருவாக்கும்தலைப்புபக்கமுடிவு = உள்ளீட்டுக்கோப்புப்பட்டி3_strip[-1] # விரிதாளின்படி, columnF, தலைப்புத்தொடங்கும் பக்க எண். 
		உருவாக்கும்தலைப்புபக்கமுடிவுகூட்டெண் = int(உருவாக்கும்தலைப்புபக்கமுடிவு)-1 + பக்கயெண்வேறுபாடு
	 
		#விளைவிடு( str(வரிசையெண்+1) + '. ' + columnA + '~' +columnB + '~' + columnC + '~' + columnD + '~' + columnE + '~' + str(பக்கயெண்வேறுபாடு) + '\n')
		
		மொழித்திட்டம்    = pywikibot.Site('ta','wikisource') 
		உரலி = pywikibot.Page(மொழித்திட்டம், துணைப்பக்கப்பெயர்)
		உரலித்தரவு = உரலி.text
		
		தரவுள்ளத்துணைப்பக்கம் = len(உரலித்தரவு)
		if தரவுள்ளத்துணைப்பக்கம் != 0:
			விளைவிடு('   ' + str(வரிசையெண்+1) + '. ' + துணைப்பக்கப்பெயர் + ' என்ற துணைப்பக்கத்தரவு உருவாக்கப் பட்டிருக்கிறது.') 
		
		elif தரவுள்ளத்துணைப்பக்கம் == 0:
			விளைவிடு('   ' + str(வரிசையெண்+1) + '. ' + துணைப்பக்கப்பெயர் + ' என்ற துணைப்பக்கத்தரவு உருவாக்கப் படவில்லை.') 
			
			துணைப்பக்கயெண்விவரம் = '<pages index="' + அட்டவணைப்பெயர்சுத்தம் + '.pdf" from="' + str(உருவாக்கும்தலைப்புபக்கத்தொடக்கம்கூட்டெண்) + '"' + 'to="' +  str(உருவாக்கும்தலைப்புபக்கமுடிவுகூட்டெண்) + '"' + 'fromsection=" " tosection=" " />'
			#<pages index=" கால்டுவெல் ஒப்பிலக்கணம்.pdf" from="20" to="23"  fromsection="" tosection="" />
			# | previous   =[[../001-013/|← 1. உயிரினும்...!]]
			# | next       = [[../003-013/| 3. கோலொடு நின்றான்! →]]
			
			உரலி.text =  '''
{{header	
 | title	      = [[../]]
 | author     =  ''' + அந்நூலாசிரியர் + ''' 
 | translator = 
 | section    = ''' + உருவாக்கும்தலைப்பு + '''
 | previous   = ''' + '[[../' + முன்துணைப்பக்கயெண்மூன்றிலக்கம்கூட்டு + '/|← ' + முன்துணைப்பக்கத்தலைப்பு + ']]' + '''
 | next       = ''' + '[[../' + பின்துணைப்பக்கயெண்மூன்றிலக்கம்கூட்டு + '/|' + பின்துணைப்பக்கத்தலைப்பு + ' →]]' + '''
 | notes	  =  <b> மொழிபெயர்த்தவர்கள்: </b> [[ஆசிரியர்:காழி. சிவ. கண்ணுசாமி பிள்ளை|காழி. சிவ. கண்ணுசாமி பிள்ளை]], [[ஆசிரியர்:கா. அப்பாத்துரைப் பிள்ளை|K. அப்பாத்துரைப் பிள்ளை]]
}}''' + 	'\n\n' + துணைப்பக்கயெண்விவரம்
			print("----------------------------  தொடக்கப்பக்க2 முழுத்தரவு  தொடக்கம்  --------------------------------------") 
			print(உரலி.text)
			print("----------------------------  தொடக்கப்பக்க2 முழுத்தரவு  முடிந்தது  --------------------------------------")
			time.sleep(15)
			உரலி.save('~' + துணைப்பக்கயெண்விவரம் )			



# முனையத்தில் இறுதியாக தெரிவதற்காக , கீழுள்ள வரியெண்ணிக்கைகளைத் தருகிறேன்.			
emptyNum = பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி)-பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி3)
விளைவிடு('\n   இக்கோப்பிலுள்ள வெற்று வரிகளின் எண்ணிக்கை  =  ' + str(emptyNum))
விளைவிடு('   இக்கோப்பிலுள்ள தரவுள்ள வரிகளின் எண்ணிக்கை = ' + str(பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி3)))
விளைவிடு('   இக்கோப்பிலுள்ள மொத்த சொல்வரியெண்ணிக்கை = ' + str(பட்டியெண்ணிக்கை(உள்ளீட்டுக்கோப்புப்பட்டி)) + '\n')

#===	 செய்ய வேண்டியன ===
# கோப்பிடங்களுக்கான பைத்தான் நூற்கட்டங்களைக் கொண்டு, கோப்பு உள்ளதா? என அறிய நுட்பம் அமைக்கணும்.
# ஒரு வரி பைத்தான் போன்று, இன்னும் நிரல்களை சுருக்க வேண்டும். # http://www.onelinerizer.com/