விக்கிமூலம்:தானியக்க மெய்ப்பு
கூகுளின் ஒளிவழி-எழுத்துணரியின் துணை கொண்டு பதிவேற்றிய நூல்களின் உரைகளை தானியக்கமாக மெய்ப்பு பார்ப்பது குறித்த குறிப்புகளை இப்பக்கத்தில் பகிரலாம். இது குறித்த முதற்கட்ட ஆய்வானது தமிழக அரசின் நாட்டுடைமையாக்கப்பட்ட நூல்கள் பதிவேற்றத் திட்டத்தைக் கருத்தில் கொண்டு அமையும்.
பிழைகளின் தன்மைகள்
[தொகு]தமிழ் எழுத்துச் சீர்திருத்தம் தொடர்பான பிழைகள்
[தொகு]அண்மைய தமிழ் எழுத்துச் சீர்திருத்தத்துக்கு முந்தைய எழுத்துகளை இனங்காண்பதில் சிக்கல் இருக்கிறது. சில எழுத்துருக்களில் சில இடங்களில் சரியாக இனங்காணப் பட்டாலும், இது பரவலாக காணப்படும் ஒரு பிரச்சினை.
எடுத்துக்காட்டுக்கு,
என்றார் -> என்றர் என இருத்தல்
ஆனால் -> ஆனல் என இருத்தல்.
இத்திருத்தத்தைக் காணுங்கள்.
இத்தகைய பிழைகள் தொடர்பான முழுமையான பட்டியல் காண்க.
எழுத்துரு தொடர்பான பிழைகள்
[தொகு]குறிப்பிட்ட ஒரு நூலில், ந வரும் இடங்களில் எல்லாம் க என்று வருதல். பெரும்பாலும், குறிப்பிட்ட எழுத்துரு வடிவமைப்பினை கூகுளின் ஒளிவழி-எழுத்துணரி, பிழையாக இனங்காண்பதன் காரணமாக இப்பிழை வருகிறது. ஆனால், இதே பிழை 100% வருவதில்லை என்பதையும் கவனிக்க வேண்டும். ஒரு சில இடங்களில் பிழையின்றியும் எழுத்தை இனங்காண்கிறது.
எடுத்துக்காட்டுக்கு, இத்திருத்தத்தைக் காணுங்கள்.
தளக்கோலம் தொடர்பான பிழைகள்
[தொகு]குறிப்பிட்ட நூலின் தளக்கோலம் (Layout) காரணமாக, சொற்களைப் பாதியில் ஒடித்து புது வரியில் எழுதுவதால் வரும் பிழை. இத்தகைய பிழைகளை இடையே உள்ள வெளியை நீக்கி ஒரே சொல்லாக மாற்றுவதன் மூலம் மாற்றலாம்.
எடுத்துக்காட்டுக்கு, இத்திருத்தத்தைக் காணுங்கள்.
எழுத்தின் மொழியை இனங்காண்பதில் வரும் பிழைகள்
[தொகு]அச்சுத் தரம், ஒளிவருடிய தரம் சீராக இல்லாத காரணத்தினாலும், பிற காரணங்களாலும் தமிழ் எழுத்துகளும் நிறுத்தக் குறிகளும் வேறு மொழியாகப் புரிந்து கொள்ளப்படுவதால் வரும் பிழைகள். ஒப்பீட்டளவில் இவை குறைவான அளவே காணப்படுகின்றன. மற்ற பிழைகளைப் போல் அன்றி, மாந்தக் கண்களுக்கு இலகுவாகப் புலப்படக்கூடியதும் ஆகும்.
எடுத்துக்காட்டுக்கு, இத்திருத்தத்தைப் பாருங்கள்.
பட எழுத்துகள் தொடர்பான பிழைகள்
[தொகு]முறையான எழுத்துருவாக இல்லாமல், தலைப்புகள் முதலியவற்றுக்கு அழகூட்டுவதற்காகப் பயன்படுத்தப்படும் பட எழுத்துகளை இனங்காண்பதில் உள்ள சிக்கலால் வரும் பிழைகள்.
இத்திருத்தத்தில் புகழ் தேடிப் புறப்பட்டவர் என்ற தலைப்பு பிழையாக எழுத்துணர்ந்திருப்பதைக் காணலாம்.
பிழைகளைத் திருத்துவதற்கான அணுகுமுறைகள்
[தொகு]உறுதியான பிழைகள்
[தொகு]தமிழ் எழுத்துச் சீர்திருத்தம் தொடர்பான பிழைகள் பல உறுதியாக இனங்காணக்கூடியவை. பல நூல்களில் திரும்பத் திரும்ப வரக்கூடியவை. இவற்றை தானியக்கமாக மாற்றலாம்.
எடுத்துக்காட்டு:
என்றர் -> என்றார்
ஆனல் -> ஆனால்
பிழையாக இருக்கக்கூடிய சொற்களின் பின்னணி நிறம் மாற்றுதல்
[தொகு]குறிப்பிட்ட ஒரு நூலில், ந வரும் இடங்களில் எல்லாம் க என்று வந்தால் ககரத்தில் தொடங்கும் சொற்களின் பின்னணி நிறத்தை மாற்றிக் காட்டி பங்களிப்பாளர்களின் கவனத்துக்குக் கொண்டு வரலாம். இப்பிழைகள் பெரும்பாலும் குறிப்பிட்ட எழுத்துரு வடிவமைப்பின் காரணமாக வருவது.
தமிழ், ஆங்கிலம், எண்கள், நிறுத்தக்குறிகள் தவிர்த்து சீனம், அரபு போன்ற பிற மொழி எழுத்துகள் வந்தாலும் இவ்வாறு நிறம் மாற்றிக் காட்டலாம்.
வளங்கள்
[தொகு]- https://github.com/tshrinivasan/tamil-wikipedia-word-list - தமிழ் விக்கிப்பீடியா சொற்கள் பட்டியல் கருவி
- https://dumps.wikimedia.org/tawikisource/latest/ - தமிழ் விக்கிமூலத் தரவு