ئۇيغۇر تىلىنىڭ ئىملا ئامبىرىنى تۈپ سۆزلەرنى تۈرلەش ئارقىلىق ياساش ھەققىدە


غەيرەت توختى كەنجى

مەن ئالدى بىلەن «ئۇيغۇر تىلىنىڭ ئىزاھلىق لۇغىتى» دىكى سۆزلۈكلەر بىلەن تەمىنلىگەن مۇھەممەت ئابدۇللا ئەپەندى بىلەن تىلكومدىكى ياسىن ئىمىن ئەپەندىگە رەھمەت ئېيتىمەن.

كىرىش سۆز

بىزنىڭ ئەدەبىي تىلىمىزدا ئىملا خاتالىقى ناھايىتى كۆپ ئۇچرايدۇ. بۇنىڭ ئاساسلىق سەۋەبىنى مەن تۆۋەندىكى 2 نۇقتىغا يىغىنچاقلايمەن.

  1. ئەدەبىي تىلىمىز كۆپ ھاللاردا ئېغىز تىلىمىزنى ئاساس قىلىپ ئوقۇغۇچىغا ھېچقانداق خاتا ئۇقۇم بەرمىگەنلىكتىن.
  2. بىر قىسىم سۆزلەرنىڭ ئىملاسىغا (تۈرلىنىشىگە، ئاجىزلىشىشىغا) نىسبەتەن ئېنىق پرىنسىپ بېكىتىلمىگەنلىكتىن.

ئۇيغۇرئېدىتنىڭ ئىملا تەكشۈرۈش قىسمىنى ئىشلەش جەريانىدا، زور مىقداردىكى سۆزلۈك ئامبىرىغا ئېھتىياجلىق بولدۇم. چۈنكى ئىملا تەكشۈرۈش -- يازغان تېكىستىمىزنىڭ تەركىبىدىكى سۆزلەرنى ئىملا ئامبىرىدىكى سۆزلەرنىڭ ئىچىدىن ئىزدەپ، بار بولسا توغرا، بولمىسا خاتا دەيدىغان ئاددىي جەرياندىن ئىبارەت بولغاچقا، ئىملاسى توغرا سۆز ئەگەر ئىملا ئامبىرىدا يوق بولسا كومپيۇتېر ئۇنى خاتاغا چىقىرىپ، ئۈنۈملۈك ئىملا تەكشۈرۈشكە مۇمكىن بولماي قالاتتى.

دەسلەپتە، تىلىمىزدىكى سۆزلەرنىڭ تۈرلىنىشچانلىقىنى نەزەرگە ئېلىپ، سۆزلەرگە ئۇلانغان قوشۇمچىنىمۇ تەكشۈرۈپ ئىملا تەكشۈرۈش ئىقتىدارىنى قوشتۇم. بۇ سەل ئۈنۈملۈك بولغان بولسىمۇ، بىراق تۈرلىنىپ كەتكەن سۆزلەرنىڭ تۈپ سۆز قىسمى بىلەن قوشۇمچە قىسمىنى ئايرىش ئۈنۈملۈك بولماي، «غا» ئۇلىنىدىغان يەرگە «قا»، «دىن» ئۇلىنىدىغان يەرگە «تىن» قاتارلىق قوشۇمچىلار ئۇلىنىپ كەتسىمۇ توغرىغا چىقىرىۋېتىپ ئىملا خاتالىقىدىن خالىي بولغىلى بولمىدى.

شۇنىڭ بىلەن سۆزلۈك مەسىلىسىنى كۆپچىلىكنىڭ كۈچىگە تايىنىپ ھەل قىلىشنى ئويلاپ ئۇيغۇرئېدىتنىڭ 2.3 نەشرىنى تارقاتقاندا كۆپچىلىككە مۇراجىئەت قىلدىم. دەرۋەقە، كۆپچىلىكنىڭ كۈچى بىلەن بىر قىسىم سۆزلۈككە ئېرىشكەن بولساممۇ، ئېرىشكەن سۆزلۈكلەرنىڭ ئىچىدە يەنە نۇرغۇن سۆزلەرنىڭ ئىملاسىدا خاتالىق بارلىقى بايقىدىم.

ئاخىرى كۆپ ئويلىنىش ئارقىلىق تۈپ سۆزلەرنى تۈرلەپ ئىملا ئامبىرى ھاسىل قىلىش قارارىغا كېلىپ بۇ يىل 5-ئايدىن باشلاپ بۇ ئىشقا تۇتۇش قىلدىم.

ئاساسىي پرىنسىپ

بۇ قېتىمقى ئىملا لۇغىتىنى ھاسىل قىلىشنىڭ ئاساسىي ئۇسۇلى، ئاۋۋال تۈپ سۆزلەرنى بارلىق ئېھتىماللىق بىلەن تۈرلەپ، ھەر بىر تۈرلىنىش يازما ماتېرىيال تەركىبىدە ئىشلىتىلدىمۇ يوق تەكشۈرۈپ، يازما ماتېرىيال تەركىبىدە ئىشلىتىلگەن بولسا بۇ سۆز ۋە ئۇنىڭ تۈرلىنىشىنى ئىملا ئامبىرى تەركىبىگە كىرگۈزۈشتىن ئىبارەت. بۇنىڭدىن كېيىن تۈپ سۆزلەر توپلىمىنى ئاساسى ئامبار، يازما ماتېرىياللاردىن يىغىلغان سۆزلەرنى خام ئامبار دەپ ئاتايمەن.

سۆزنى تۈرلەشتىن ئاۋۋال سۆزنىڭ لۇغەت تەركىبىنى بىلىشكە توغرا كېلىدۇ. ئاندىن قالسا ئۇنىڭغا قانداق قوشۇمچە ئۇلىنىدىغانلىقى ئېنىقلىۋېلىش كېرەك. مۇشۇ ئىككى نەرسە ئېنىق بولسا ئۇيغۇر تىلىدىكى سۆزلەرنى كومپيۇتېر بىمالال تۈرلىيەلەيدۇ.

تىلىمىزدىكى سۆزلەرنىڭ لۇغەت تەركىبى 13 كە بۆلۈنگەن. ئۇلار ئىسىم، سۈپەت، سان، پېئىل، رەۋىش، ئالماش، مىقدار سۆز، ئىملىق سۆز، باغلىغۇچى، يۈكلەنمە، تىركەلمە، تەقلىد سۆز، بىرىكمە سۆز(«ئۇيغۇر تىلىنىڭ ئىزاھلىق لۇغىتى» دە مۇشۇنداق ئايرىلغان). ھەر بىر سۆز يۇقىرىقى خالىغان بىر ياكى بىرقانچە تۈركۈمگە تەۋە بولىدۇ. مەسىلەن: «ئادەم»، «ماشىنا»، «بەڭۋاشلىق» قاتارلىقلار ئىسىمغا تەۋە بولسا، «يازماق»، «خاتىرىلىمەك»، «ئوقۇماق» قاتارلىقلار پېئىلغا تەۋە. «بوۋاق» بولسا ھەم ئىسىم ھەم سۈپەتكە تەۋە....

سۆزنىڭ تۈركۈمى ئېنىقلانغاندىن كېيىن شۇ سۆز تۈركۈمىدىكى سۆزلەر قانداق تۈرلىنىدۇ، ئۇنىڭغا قانداق قوشۇمچە ئۇلىنىدۇ بىلىش زۆرۈر. بۇ مەسىلىلەر «ھازىرقى زامان ئۇيغۇر تىلى» دېگەن كىتابتا ئەتراپلىق چۈشەندۈرۈلگەن.

ھەممىمىزگە مەلۇم، ئىسىملار بىرلىك ۋە كۆپلۈك قوشۇمچىلىرى بىلەن، كېلىشلەر بىلەن، 3 شەخسنىڭ بىرلىك ھەم كۆپلۈكى بىلەن تۈرلىنىدۇ. يۇقىرىقىلار يەنە يەنە كېلىشلەر بىلەن تۈرلىنىدۇ. يەنى ئىككى قات تۈرلىنىدۇ.شۇنداقتا بىر ئىسىمنىڭ كەم دېگەندىمۇ 100 خىل تۈرلىنىدۇ. پېئىللارنىڭ تۈرلىنىشى تېخىمۇ كۆپ ھازىرقى باسقۇچتا ھەر بىر پېئىل 2836 خىل تۈرلەندى.

قالغان سۆز تۈركۈملىرىمۇ تۈرلىنىشى ئالاھىدىلىكىگە قاراپ ئوخشىمىغان ساندا تۈرلەندى. بۇ يەردە ھەممىنى بىر-بىرلەپ چۈشەندۈرۈپ ئولتۇرمايمەن.

ھازىر ئاساسىي ئامباردا جەمئىي 39 مىڭ سۆز بار. بۇنىڭ ئىچىدە پېئىل 9000 مىڭغا يېقىن. ئەگەر يۇقىرىقى تۈرلىنىشلەرنىڭ ھەممىسىنى ئىملا ئامبىرىغا قوشساق بىرنەچچە مىليون سۆزلۈك بولۇپ كېتىدۇ. بۇلارنىڭ تۈرلىنشىلىرىنىڭ ھەممىسى ئەدەبىي تىلىمىزدا ئىشلىتىلىشى ناتايىن پەقەت بىر قىسىم كۆپ ئىشلىتىلىدىغان سۆزلەرنىڭ تۈرلىنىشلىرىلا ئەدەبىي تىلدا تولۇق ئىشلىتىلىدۇ. بىراق قايسى سۆزنىڭ كۆپ ئىشلىتىلىدىغان سۆز قايسىسىنىڭ ئەمەس، تېخى ئۇيغۇر تىلىدا ئېنىق بىر ستاتىستىكا يوق. شۇڭا بارلىق سۆزلەرنى تۈرلىگەندىن كېيىن سۆزنىڭ تۈرلىنىشلىرى ئەدەبىي تىلدا ئىشلىتىلدىمۇ يوق، بۇنى ھېكايە، رومان ۋە باشقا يازما ماتېرىياللارنى تەكشۈرۈش ئارقىلىقلا بىلىش مۇمكىن.

شۇڭا بۇ يەردە يەنە نۇرغۇنلىغان يازما ماتېرىياللارغا ئېھتىياجىم تۇغۇلدى. بۇ ھەقتىمۇ تورداشلارغا مۇراجىئەت قىلىپ 10 مېگابايت ئەتراپىدىكى يازما ماتېرىياللارغا ئېرىشتىم. بىراق بۇلارمۇ تازا يېتەرلىك بولمىدى. شۇنىڭ بىلەن ئۇيغۇرچە تور بەتلىرىدىكى تېكىستلەرنى يىغىدىغان پروگرامما ئىشلەپ توردىن تېكىست يىغدىم. 40 نەچچە تور بېكىتىدىن 11-ئاينىڭ 11-كۈنىگىچە 807 مېگابايت ھەجمىدە تېكىستلەر يىغىلدى. خام ئامبار تەركىبىدىكى سۆز 676 مىڭغا يەتتى. بۇنىڭدىن پايدىلىنىپ ھاسىل قىلىنغان ئىملا ئامبىرىدىكى سۆز 304 مىڭغا يەتتى.

بۇ ئىملا ئامبىرىنىڭ 0.1 نەشرى بولۇپ ھېسابلىنىدۇ. ھەر 10 مىڭ سۆز كۆپەيگەندە، نەشرى ئېشىپ ماڭىدۇ ۋە UKIJ بېكىتىدە ئېلان قىلىنىدۇ.

يېڭىلىنىشلار:

  1. 2006-يىل 11-ئاينىڭ 14-كۈنى: ئىملا ئامبىرىنىڭ 0.1 نەشرى تاماملاندى(304 مىڭ سۆزلۈك). بۇ يەردىن چۈشۈرۈڭ
  2. 2006-يىل 11-ئاينىڭ 18-كۈنى: ئىملا ئامبىرىنىڭ 0.2 نەشرى تاماملاندى(317 مىڭ سۆزلۈك). بۇ يەردىن چۈشۈرۈڭ
    0.2 نەشرىنى تاماملاشتا بىلىۋال نىڭ قۇرغۇچىسى قۇربانجان روزى ئەپەندىم بىلەن، ئابدۇقادىر ئابلىز (سەھرالىق ئادەم) خام ئامبار بىلەن تەمىنلىدى. ئۇلارغا تەشەككۈر.
  3. 2006-يىل 12-ئاينىڭ 05-كۈنى: ئىملا ئامبىرىنىڭ 0.3 نەشرى تاماملاندى(351 مىڭ سۆز.
    0.3 نەشرىنى تاماملاشتا ياپونىيە چىبا ئۇنىۋېرسىتېتىدا ئوقۇۋاتقان خېلىل ئەپەندى بىلەن 中国传媒大学 دە ئوقۇۋاتقان سەمەت مەمتىمىن ئەپەندى، ئەلسوفت تور بېكىتىدىن ئادىل ئابدۇرېھىم (نىدا) ئەپەندى ۋە باشقا نامسىز تورداشلار خام ئامبار بىلەن تەمىنلىدى. ئۇلارغا تەشەككۈر. بۇ قېتىمقى خام ئامبارغا يەنە تىزىملىكتىكى تور بەتلىرىنىڭ 11-ئايلىق مەزمۇنلىرىدىكى سۆزلەرمۇ كىرگۈزۈلدى.خام ئامباردىكى سۆز سانى 799085گە يەتتى. بۇ نۇسخا ئۇيغۇرئېدىت بىلەن بىرگە تورغا قويۇلدى.
  4. 2007-يىل 1-ئاينىڭ 3-كۈنى: ئىملا ئامبىرىنىڭ 0.4 نەشرى تاماملاندى(375 مىڭ سۆز). بۇ يەردىن چۈشۈرۈڭ
    0.4 نەشرىنى تاماملاشتا بىلىۋال نىڭ قۇرغۇچىسى قۇربانجان روزى ئەپەندىم بىلىۋال بېكىتىنىڭ ساندانىدىكى بارلىق مەزمۇنلارنى تېكىست ھۆججىتىگە ئايلاندۇرغاندىن كېيىن، ئىملاسىنى تەكشۈرۈپ ئاندىن ماڭا ئەۋەتىپ بەردى. قۇربانجان روزى ئەپەندىمگە كۆپ تەشەككۈر بىلدۈرىمەن. بۇ قېتىمقى خام ئامبارغا يەنە تىزىملىكتىكى تور بەتلىرىنىڭ 12-ئايلىق مەزمۇنلىرىدىكى سۆزلەرمۇ كىرگۈزۈلدى.خام ئامباردىكى سۆز سانى 878248 گە يەتتى.

قوشۇمچە:

  1. خام ئامبار. بۇنى بۇ يەردىن چۈشۈرۈڭ
  2. پېئىلنىڭ تۈرلىنىش نەتىجىسى(8 دانە پېئىلنىڭ تۈرلىنىش نەتىجىسى)نى بۇ يەردىن كۆرۈڭ
    پېئىللارنىڭ تۈرلىنىشىدە خاتالىقلارنىڭ بولۇشى مۇقەررەر. كوررېكتورلارنىڭ مەزكۇر تۈرلىنىشنى كۆرۈپ خاتالىقلارنى كۆرسىتىپ بېرىشىنى ئارزۇ قىلىمەن.
  3. توردىن تېكىست يىغىش پروگراممىسىنىڭ ئەسلى كودى. Java دا تۈزۈلگەن Java نىڭ 1.4 ۋە ئۇنىڭدىن يۇقىرى نەشرلىرىدە ئىشلەتكىلى بولىدۇ.

خام ئامبار يىغىشتا پايدىلانغان بېكەتلەرنىڭ ئادرېسلىرى

ئەگەر تورداشلار مەزمۇنى كۆپ بولغان بېكەت ئادرېسلىرىنى بىلسە ئۇنى، قولىدا بار بولغان ھەرقانداق يازما ماتېرىياللارنى ئىملاسىنىڭ قانداق بولۇشىدىن قەتئىي نەزەر شۇ پېتى ياكى سۆزگە پارچىلاپ gheyret@yahoo.com غا ئەۋەتسىڭىز تولىمۇ خۇرسەن بولىمەن.

ئەڭ ئاخىرى تۈزىتىلگەن ۋاقىت: 2007-يىل 1-ئاينىڭ 3-كۈنى