এআই কেন এআইয়ের লেখা ধরতে পারে না: কৃত্রিম বুদ্ধিমত্তার লুকোচুরি ও সীমাবদ্ধতার গল্প

কেন এআই দিয়ে তৈরি লেখা শনাক্ত করা প্রায় অসম্ভব?

কেন এআই দিয়ে তৈরি লেখা শনাক্ত করা প্রায় অসম্ভব?


​বর্তমান যুগটি হলো কৃত্রিম বুদ্ধিমত্তার বা এআই (AI) বিপ্লবের যুগ। চ্যাটজিপিটি (ChatGPT), ক্লড (Claude) কিংবা জেমিনির (Gemini) মতো লার্জ ল্যাঙ্গুয়েজ মডেলগুলো এখন আমাদের প্রাত্যহিক জীবনের অংশ। ইমেইল লেখা থেকে শুরু করে একাডেমিক অ্যাসাইনমেন্ট বা অফিসের রিপোর্ট—সবখানেই এআইয়ের পদচারণা। কিন্তু এর সাথে সাথেই একটি বড় বিতর্ক সামনে এসেছে: এআই দিয়ে লেখা কন্টেন্ট কি শনাক্ত করা সম্ভব?

​মজার ব্যাপার হলো, যে এআই এত চতুরভাবে লেখা তৈরি করছে, সেই এআই দিয়েই তৈরি করা 'এআই ডিটেক্টর'গুলো অনেক সময় ব্যর্থ হচ্ছে। আজ আমরা গভীরে গিয়ে দেখব কেন এআই আসলে নিজের বা অন্য এআইয়ের লেখা নিখুঁতভাবে ধরতে পারে না।

​১. এআই যেভাবে কাজ করে: এটি কোনো 'লেখক' নয়, এটি একটি 'প্রেডিকশন ইঞ্জিন'

​এআই কীভাবে লেখা তৈরি করে তা বুঝতে পারলে কেন এটি ধরা কঠিন তা বোঝা সহজ হয়। এআই মূলত পরিসংখ্যানের ওপর ভিত্তি করে কাজ করে। একে বলা হয় Next Token Prediction

​যখন আপনি এআইকে কোনো প্রম্পট দেন, সে তার বিশাল ডেটাসেট থেকে হিসাব করে যে, একটি শব্দের পর কোন শব্দটি আসার সম্ভাবনা সবচেয়ে বেশি। উদাহরণস্বরূপ, যদি বাক্যটি হয় "আকাশের রং...", তবে এআই জানে যে পরবর্তী শব্দটি "নীল" হওয়ার সম্ভাবনা ৯৯%।

​যেহেতু এআই মানুষের লেখা বিশাল তথ্যের ভাণ্ডার (ইন্টারনেট, বই, গবেষণা পত্র) পড়ে শিক্ষিত হয়েছে, তাই তার লেখার ধরন হুবহু মানুষের মতোই হয়। যখন কোনো ডিটেক্টর সেই লেখাটি পরীক্ষা করে, সে আসলে কোনো 'সৃজনশীলতার ছাপ' খোঁজে না, সে খোঁজে গাণিতিক প্যাটার্ন। আর এআই যদি সেই প্যাটার্নটি মানুষের মতো করে নকল করতে পারে, তবে ডিটেক্টর বিভ্রান্ত হয়ে যায়।

​২. ডিটেকশন টুলগুলোর কাজের পদ্ধতি এবং তাদের সীমাবদ্ধতা

​বেশিরভাগ এআই ডিটেক্টর দুটি প্রধান বিষয়ের ওপর ভিত্তি করে কাজ করে:

  • Perplexity (জটিলতা): লেখাটি কতটা জটিল বা অপ্রাসঙ্গিক। মানুষের লেখায় অনেক সময় এলোমেলো চিন্তা থাকে যা ডিটেক্টরের কাছে 'উচ্চ পারপ্লেক্সিটি' হিসেবে গণ্য হয়।
  • Burstiness (বৈচিত্র্য): বাক্যের দৈর্ঘ্যের ভিন্নতা। মানুষ কখনো ছোট বাক্য লেখে, আবার কখনো দীর্ঘ ও জটিল বাক্য। এআইয়ের লেখায় সাধারণত একটি নির্দিষ্ট ছন্দ বা অভিন্নতা থাকে।

কেন এগুলো কাজ করে না? আধুনিক এআই মডেলগুলো এখন মানুষের এই 'Burstiness' এবং 'Perplexity' নকল করতে শিখে গেছে। আপনি যদি এআইকে বলেন, "একটু অগোছালোভাবে লেখো" বা "বাক্যের দৈর্ঘ্যে বৈচিত্র্য আনো", তবে সে এমনভাবে লিখবে যা ডিটেক্টরকে অনায়াসেই ফাঁকি দেবে।

​৩. ভাষার কোনো 'ডিজিটাল সিগনেচার' নেই

​ছবির ক্ষেত্রে যেমন মেটাডেটা থাকে বা পিক্সেলের বিশেষ বিন্যাস থাকে, টেক্সটের ক্ষেত্রে তেমন কিছু নেই। একটি 'A' অক্ষর এআই লিখলে যা, মানুষ লিখলেও তা-ই।

​যখন একটি এআই কোনো অনুচ্ছেদ লেখে, সে কোনো গোপন কোড বা জলছাপ (Watermark) রেখে যায় না। যদিও ওপেনএআই (OpenAI) টেক্সট ওয়াটারমার্কিং নিয়ে কাজ করছে, কিন্তু সেটিও খুব সহজেই প্যারাফ্রেজিং (শব্দ পরিবর্তন) করে মুছে ফেলা সম্ভব। যেহেতু ভাষার প্রতিটি শব্দ উন্মুক্ত, তাই কোনো নির্দিষ্ট শব্দগুচ্ছকে দেখে শতভাগ নিশ্চিত হওয়া অসম্ভব যে এটি এআই লিখেছে।

​৪. 'ফলস পজিটিভ' বা নির্দোষকে দোষী সাব্যস্ত করার ঝুঁকি

​এআই ডিটেক্টরগুলোর সবচেয়ে বড় সমস্যা হলো False Positive। অর্থাৎ, একজন মানুষের মৌলিক লেখাকে এআইয়ের লেখা হিসেবে চিহ্নিত করা।

​গবেষণায় দেখা গেছে, যারা ইংরেজি যাদের মাতৃভাষা নয় (Non-native speakers), তারা যখন খুব সাধারণ এবং ব্যাকরণগতভাবে সঠিক ইংরেজি লেখেন, ডিটেক্টরগুলো সেটিকে এআইয়ের লেখা বলে ধরে নেয়। কারণ? এআই এবং নন-নেটিভ স্পিকার—উভয়েই খুব সাধারণ এবং প্রচলিত শব্দ ব্যবহার করেন। এই ভুলের কারণে অনেক শিক্ষার্থীর ক্যারিয়ার বা লেখকের সম্মান নষ্ট হওয়ার ঝুঁকি থাকে, যা প্রমাণ করে যে এই প্রযুক্তিগুলো এখনো নির্ভরযোগ্য নয়।

​৫. এআই বনাম এআই: এক অন্তহীন ইঁদুর-বেড়াল দৌড়

​এটি অনেকটা অ্যান্টিভাইরাস এবং ভাইরাসের যুদ্ধের মতো। যখনই কোনো নতুন ডিটেকশন অ্যালগরিদম তৈরি হয়, এআই মডেলগুলো তার চেয়েও উন্নত ডেটা দিয়ে প্রশিক্ষিত হয়।

​আজকের জিপিটি-৪ বা জেমিনি ১.৫ মডেলগুলো এতই উন্নত যে তারা মানুষের আবেগ, উপমা এবং সূক্ষ্ম রসবোধও নকল করতে পারে। এমনকি 'Quillbot' এর মতো টুলগুলো ব্যবহার করে এআইয়ের লেখাকে একটু এদিক-সেদিক করে দিলেই ডিটেক্টরগুলো আর কিছুই ধরতে পারে না। ডিটেক্টরগুলো সবসময় এক ধাপ পিছিয়ে থাকে কারণ তারা 'অতীতের ডেটা' দিয়ে বর্তমানের 'অত্যাধুনিক এআই' ধরার চেষ্টা করছে।

​৬. সৃজনশীলতার কোনো নির্দিষ্ট ফর্মুলা নেই

​মানুষের সৃজনশীলতা অসীম। একজন লেখক ইচ্ছা করেই ব্যাকরণ ভুল করতে পারেন বা নতুন কোনো শব্দ উদ্ভাবন করতে পারেন। এআই যখন এই সৃজনশীলতাকে অনুকরণ করার চেষ্টা করে, তখন সে আসলে মানুষের দেওয়া ডেটাই ব্যবহার করে।

​যদি কোনো মানুষ খুব গোছানো এবং প্রাঞ্জল ভাষায় লেখে, তবে ডিটেক্টর মনে করে এটি এআই। অন্যদিকে এআই যদি ইচ্ছা করে একটু অগোছালো হয়, তবে ডিটেক্টর মনে করে এটি মানুষ। এই যে সংজ্ঞার অস্পষ্টতা, এটাই এআই শনাক্তকরণের পথে সবচেয়ে বড় বাধা।

​৭. কেন আমরা এআই ধরা নিয়ে এত চিন্তিত?

​ব্লগের এই পর্যায়ে একটি গুরুত্বপূর্ণ প্রশ্ন আসে—আমরা কেন এআই ধরতে চাইছি?

  • একাডেমিক সততা: শিক্ষার্থীরা নিজেরা না লিখে এআই দিয়ে অ্যাসাইনমেন্ট করাচ্ছে কিনা।
  • সার্চ ইঞ্জিন অপ্টিমাইজেশন (SEO): গুগল কি এআই কন্টেন্ট পছন্দ করে? (যদিও গুগল এখন বলছে কন্টেন্টের মান ভালো হলে এআই দিয়ে লেখা হলেও সমস্যা নেই)।
  • ভুল তথ্য রোধ: এআই খুব আত্মবিশ্বাসের সাথে ভুল তথ্য বা 'Hallucination' তৈরি করতে পারে।

​কিন্তু সমস্যা হলো, ডিটেক্টরগুলো যখন অকেজো হয়ে পড়ে, তখন আমাদের নির্ভর করতে হয় মানুষের বিচারবুদ্ধির ওপর। আর সেখানেই এআই জিতে যায়, কারণ সে মানুষের বিচারবুদ্ধিকে বিভ্রান্ত করার ক্ষমতা অর্জন করেছে।

​৮. ভবিষ্যতের সমাধান কী?

​এআইয়ের লেখা ধরার জন্য কেবল সফটওয়্যারের ওপর নির্ভর করা এখন বোকামি। ভবিষ্যতের পথ হতে পারে দুটি:

১. ওয়াটারমার্কিং (Watermarking): মডেল তৈরির সময় শব্দ নির্বাচনের প্যাটার্নে একটি অদৃশ্য গাণিতিক সিগনেচার ঢুকিয়ে দেওয়া।

২. প্রক্রিয়ার ওপর গুরুত্ব দেওয়া: লেখাটি 'কী' তার চেয়ে লেখাটি 'কীভাবে' তৈরি হলো তার ওপর নজর দেওয়া। যেমন—গুগল ডকসের এডিট হিস্ট্রি দেখা।

​এআই কেন এআইয়ের লেখা ধরতে পারে না—তার সহজ উত্তর হলো: এআই আসলে মানুষের আয়না। সে আমাদের ভাষাকে এতটাই নিখুঁতভাবে প্রতিফলিত করছে যে, আয়নার প্রতিবিম্ব আর বাস্তবের মানুষের মধ্যে পার্থক্য করা কঠিন হয়ে পড়েছে।

​ডিটেক্টরগুলো গাণিতিক সীমাবদ্ধতার জালে বন্দি, আর এআই সেই গণিতকে ব্যবহার করেই সৃজনশীলতার অভিনয় করছে। তাই দিনশেষে, কোনো লেখা এআইয়ের কি না তা জানার চেয়ে বেশি গুরুত্বপূর্ণ হওয়া উচিত—লেখাটি তথ্যবহুল, সত্য এবং পাঠকের জন্য উপকারী কি না। প্রযুক্তির এই যুদ্ধে হয়তো কোনোদিন ডিটেক্টর জিতবে না, বরং আমাদের মানিয়ে নিতে হবে এমন এক পৃথিবীর সাথে যেখানে মানুষের চিন্তা আর কৃত্রিম বুদ্ধিমত্তার সৃজন মিশে একাকার হয়ে যাবে।

আপনার কি মনে হয়? এআই ডিটেক্টরগুলো কি কখনো ১০০% সঠিক হতে পারবে, নাকি এটি একটি অসম্ভব স্বপ্ন? কমেন্টে আপনার মতামত জানান!

একটি মন্তব্য পোস্ট করুন

নবীনতর পূর্বতন