কৃত্রিম বুদ্ধিমত্তা সম্পর্কে যা জানা দরকার
সবখানেই এখন কৃত্রিম বুদ্ধিমত্তার (এআই) ব্যবহার। এআই প্রযুক্তির অনেক বিষয়ই এখনো অনেকের অজানা। এই প্রযুক্তি নিয়ে কিছু নতুন বিষয় সামনে এসেছে। কৃত্রিম বুদ্ধিমত্তাকে বুঝতে এসব বিষয় জানা জরুরি।
কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি অ্যাপলের সফটওয়্যার সিরির মতো ভার্চু৵য়াল সহকারীর ব্যবহার বাড়িয়ে দিয়েছে। এটি চিকিৎসকদের এমআরআইয়ের মাধ্যমে ক্যানসার শনাক্ত করার কাজে সহায়তা করছে। এ ছাড়া কাজ করছে মুঠোফোনের মাধ্যমে চেহারা শনাক্ত করতে।
যেসব প্রোগ্রাম বা সরঞ্জাম ব্যবহার করে কনটেন্ট বা আধেয় তৈরি করা যায়, সেই খাতকে চাঙা করে তুলেছে এআই। চ্যাটজিপিটি ও বার্ডের মতো চ্যাটবটগুলো সফটওয়্যার কোড লেখার পাশাপাশি বই লেখার কাজেও ব্যবহার করা হচ্ছে। কৃত্রিম বুদ্ধিমত্তাসম্পন্ন কণ্ঠস্বর প্রয়োগের প্রোগ্রামগুলো বিভিন্ন ক্ষেত্রে তারকাদের মতো কণ্ঠস্বর তৈরি করে দিচ্ছে। অল্প কিছু টেক্সট দিয়েই দারুণ ছবি তৈরি করে দিচ্ছে কৃত্রিম বুদ্ধিমান প্রোগ্রাম।
প্রযুক্তিশিল্পে বৈপ্লবিক পরিবর্তন আনতে পারে এই যুগান্তকারী প্রযুক্তি। কিন্তু এ পর্যন্ত এ প্রযুক্তির ব্যবহার নিয়ে সংশয়ও রয়ে গেছে। কিছু প্রোগ্রাম কীভাবে কাজ করে তার ব্যাখ্যা দিতে গিয়ে সমস্যায় পড়ছেন বিশেষজ্ঞরা। কৃত্রিম বুদ্ধিমত্তা খাতের এই অগ্রগতি অমিত সম্ভাবনাময় ভবিষ্যৎ, নাকি বিপজ্জনক নতুন বাস্তবতার মুখোমুখি করবে, তা নিয়ে ভিন্নমত প্রকাশ করেন প্রযুক্তিখাতের শীর্ষস্থানীয়রা।
কৃত্রিম বুদ্ধিমত্তা কী
কৃত্রিম বুদ্ধিমত্তার একক কোনো সংজ্ঞা নেই। গবেষকেরাও এর সংজ্ঞা নিয়ে একমত নন। যুক্তরাষ্ট্রের নর্থওয়েস্টার্ন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক ল্যারি বার্নবাউম বলেন, সাধারণভাবে বলতে গেলে, কৃত্রিম বুদ্ধিমত্তা হলো কম্পিউটার বিজ্ঞানের এমন একটি ক্ষেত্র, যেখানে বুদ্ধিদীপ্ত কাজ করতে যন্ত্র তৈরি ও প্রশিক্ষণের ওপর গুরুত্ব দেয়। একই কাজ কোনো ব্যক্তি করলে আমরা তাকে বুদ্ধিমান বলে থাকি।
কয়েক দশক ধরে কৃত্রিম বুদ্ধিমত্তা মূলত বিশ্লেষণী কাজে ব্যবহৃত হয়ে আসছে। এতে বিশাল তথ্যভান্ডার (বিশাল ডেটা সেট) বিশ্লেষণ করে কোনো বিষয়ের প্রশিক্ষণ দেওয়া বা ধরন চিহ্নিত করার কাজ করার সুবিধা পাওয়া যায়। কিন্তু এ ক্ষেত্রে উন্নতির ফলে ‘জেনারেটিভ এআই’ ক্ষেত্রটির ব্যাপক প্রসার ঘটেছে। জেনারেটিভ এআই হচ্ছে, কৃত্রিম বুদ্ধিমত্তার একটি রূপ যা কোনো বস্তু তৈরি করতে পারে। এই প্রযুক্তি কোনো শব্দ, ছবি, ভিডিওর মতো বিষয় সৃষ্টি করতে পারে। অনেক সময় এই পদ্ধতি মানুষের সৃজনশীলতার মতো জটিল বিষয়টি অনুকরণ করে থাকে। এখনকার জনপ্রিয় চ্যাটবট চ্যাটজিপিটি ও ছবি প্রস্তুতকারক ডাল-ইর মতো প্রোগ্রামে রয়েছে কৃত্রিম বুদ্ধিমত্তার এই সক্ষমতা।
কৃত্রিম বুদ্ধিমত্তার কিছু সীমাবদ্ধতা আছে। মানুষ যেভাবে চিন্তা করে, কৃত্রিম বুদ্ধিমত্তা তা পারে না। এটি অনেক সময় একই মানের কাজ করে থাকে। কৃত্রিম বুদ্ধিমান সফটওয়্যারে আঁকা ছবি যেমন প্রতিযোগিতায় পুরস্কার জিতেছে। বিচারকদের চমকে দিয়েছে। বিচারক কৃত্রিম বুদ্ধিমত্তার আঁকা ছবির সঙ্গে শিল্পীর আঁকা ছবির পার্থক্য বের করতে পারেননি। এ ছাড়া ভয়েস জেনারেটিং সফটওয়্যার এএলএসের রোগে আক্রান্ত ব্যক্তিদের কণ্ঠস্বর সংরক্ষণ করেছে।
তথ্য ছাড়া কৃত্রিম বুদ্ধিমত্তা আর কিছু নয়
বিভিন্ন প্রোগ্রাম বা টুল মেশিন লার্নিংয়ের মাধ্যমে বুদ্ধিমত্তা বিকাশ করে। এটি এমন একটি প্রক্রিয়া, যাতে কম্পিউটার নিজে থেকে অনেক কিছু শেখে। এতে আলাদা করে কোনো প্রোগ্রামারের নির্দেশের প্রয়োজন পড়ে না। কোনো কম্পিউটারকে বিপুলসংখ্যক তথ্য জোগান দিলে এটি বিভিন্ন প্যাটার্ন বা ধরন শণাক্ত করতে বা ফলাফলের পূর্বাভাস দিতে সক্ষম হয়। এই প্রক্রিয়ার মূল হচ্ছে, ‘নিউরাল নেটওয়ার্ক’।
এটি মূলত গাণিতিক পদ্ধতি যা কম্পিউটারের মস্তিষ্ক হিসেবে কাজ করে। এটি বিভিন্ন তথ্যের মধ্যে যোগসূত্র খুঁজে বের করে। মানুষের মস্তিষ্কের মতো এগুলোকে বিভিন্ন মডেলে সাজানো থাকে। বিভিন্ন স্তরের কৃত্রিম নিউরনের মাধ্যমে এগুলো পরস্পরের সঙ্গে তথ্য আদান–প্রদান করে। নিউরাল নেটওয়ার্ক ঠিক কীভাবে কাজ করে, অনেক সময় বিশেষজ্ঞরাও তা বুঝে উঠতে পারেন না।
কৃত্রিম বুদ্ধিমত্তা এখন কয়েক সেকেন্ডের মধ্যেই নতুন ছবি তৈরি করতে পারে। এটি একদিকে যেমন বিস্ময়ের, তেমনি বিপজ্জনক।
লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) হলো একধরনের নিউরাল নেটওয়ার্ক, যা লিখতে শেখে এবং ব্যবহারকারীর সঙ্গে কথোপকথন চালাতে জানে। এই ল্যাঙ্গুয়েজ মডেলের ওপর ভিত্তি করেই বর্তমানে জনপ্রিয় সব চ্যাটবট তৈরি করা হয়েছে। বিশাল টেক্সট, ইন্টারনেটে থাকা বিভিন্ন ওয়েবসাইটের তথ্য ঘেঁটে এবং বিভিন্ন শব্দের মধ্যে পরিসংখ্যানগত সম্পর্ক বিবেচনা করে এই চ্যাটবট কথা বলতে শেখে। যখন এসব সিস্টেমের ধরনে মিল পাওয়া যায়, তখন সৃজনশীলতার ফলে এক ধাপ এগিয়ে যায় চ্যাটবট। এ প্রক্রিয়ায় গান লেখার মতো কাজও করে এ ধরনের কৃত্রিম বুদ্ধিমান প্রোগ্রাম। তবে এলএলএমের এসব শব্দের অর্থ সম্পর্কে সচেতনতা নেই।
কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে বিবেচ্য বিষয় হচ্ছে, প্যারামিটার। বৃহৎ ভাষা মডেলের প্রশিক্ষণ তথ্যের সংখ্যাসূচক পয়েন্ট হচ্ছে এই প্যারামিটার। কোনো কাজে কৃত্রিম বুদ্ধিমত্তা কতটা দক্ষ, তা এই প্যারামিটারের ওপর নির্ভর করে। কোনো বাক্যে গঠনের ক্ষেত্রে একটি শব্দের পর আরেকটি শব্দ কী হবে, তা এই প্যারামিটারের ওপর নির্ভর করে ধারণা পায় কৃত্রিম বুদ্ধিমত্তা।
গবেষকেরা বলছেন, ভবিষ্যতে কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি আর্টিফিশিয়াল জেনারেল ইনটেলিজেন্সের (এজিআই) দিকে এগোবে। এটি এমন একটি সীমা যেখানে কৃত্রিম বুদ্ধিমত্তা মানুষের সমকক্ষ হয়ে উঠবে বা মানুষের বুদ্ধিমত্তাকে ছাড়িয়ে যাবে। মার্কিন প্রযুক্তি প্রতিষ্ঠান ও চ্যাটজিপিটির উদ্ভাবক ওপেনএআইয়ের মতো প্রতিষ্ঠানের প্রধান লক্ষ্য এজিআই অর্জন। প্রতিষ্ঠানটির নথি অনুযায়ী, তারা এজিআই অর্জনের লক্ষ্য ঠিক রেখেছে। বিশেষজ্ঞদের অনেকে ধারণা করেন, কৃত্রিম বুদ্ধিমত্তা এজিআই অর্জনের কাছাকাছি পৌঁছে গেছে। তবে সমালোচকেরা বলেন, এটা কেবল বিপণনের কৌশল।
আমরা কীভাবে এআই ব্যবহার করব
কৃত্রিম বুদ্ধিমত্তার অভিজ্ঞতা নেওয়ার সবচেয়ে সাধারণ উপায় চ্যাটবটের ব্যবহার। এটা অনেকটাই উন্নত বার্তা আদান–প্রদানের অ্যাপের (ইনস্ট্যান্ট মেসেঞ্জার) মতো কাজ করে। এটি ব্যবহারকারীর বিভিন্ন প্রশ্নের উত্তর দেওয়ার পাশাপাশি বিভিন্ন নির্দেশ মেনে কাজ করে ও অনুসন্ধানের ফল সামনে হাজির করে।
এগুলো মূলত রোবট বা বট। এগুলোকে ইন্টারনেটের বিশাল তথ্যভান্ডার থেকে প্রশিক্ষণ দিয়ে রাখা হয়েছে। এগুলোর মধ্যে ডিজিটাল বই থেকে শুরু করে রেডিটের মতো অনলাইন সাইটের কথোপকথন শেখানো আছে।
বিশেষজ্ঞরা বলেন, চ্যাটবট বিভিন্ন প্যাটার্ন খুঁজে বের করতে এবং কথোপকথন অনুকরণে অবিশ্বাস্যভাবে পারদর্শী। তবে এর অর্থ ব্যাখ্যা করতে পারে না। যুক্তরাষ্ট্রের নর্থওয়েস্টার্ন বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক ল্যারি বার্নবাউম বলেন, চ্যাটবট অটোকমপ্লিটের দ্রুত অনুকরণের সংস্করণ।
গত বছরের নভেম্বরে উন্মুক্ত হয় চ্যাটজিপিটি। এরপর থেকে এটি ভাষাগত দক্ষতায় ব্যবহারকারীদের মুগ্ধ করেছে। চ্যাটজিপিটি ব্যবহার করে সম্পূর্ণ উপন্যাস লেখা, কোড লেখা, টেলিভিশনের জন্য ধারবাহিক নাটক ও গান লেখার মতো কাজ করা সম্ভব হয়েছে। জিপিটি অর্থ হচ্ছে ‘জেনারেটিভ প্রি-ট্রেইন্ড ট্রান্সফরমার’। জেনারেটিভ অর্থ হলো এটি কৃত্রিম বুদ্ধিমত্তার সাহায্যে কোনো কিছু তৈরি করে। প্রি-ট্রেইন্ড অর্থ একে আগে থেকেই বিশাল তথ্যভান্ডারের মাধ্যমে প্রশিক্ষণ দেওয়া হয়েছে। ট্রান্সফরমার অর্থ, এতে শক্তিশালী নিউরাল নেটওয়ার্ক ব্যবহার করা হয়েছে, যা ভাষাকে প্রক্রিয়াজাত করতে পারে।
যুক্তরাষ্ট্রের সানফ্রান্সিসকোভিত্তিক ওপেনএআই চ্যাটজিপিটি উন্মুক্ত করার পর অনেক প্রতিষ্ঠান এমন চ্যাটবট তৈরির পেছনে ছুটছে। মাইক্রোসফটের চ্যাটবট বিং চ্যাটজিপিটির মতো প্রযুক্তির ব্যবহার শুরু করেছে। এ ছাড়া গুগল নিজেদের চ্যাটবট বার্ড উন্মুক্ত করেছে। এতে তারা তাদের ল্যাম্বডা মডেল ব্যবহার করেছে।
অনেকে ধারণা করছেন, মানুষ এখন ইন্টারনেটে যেভাবে তথ্য খোঁজে ও ব্যবহার করে; চ্যাটবট সে ধারণা বদলে দেবে। সার্চ ইঞ্জিনে কোনো কিছু লিখে তথ্য খোঁজার পরিবর্তে মানুষ চ্যাটবটকে প্রশ্ন করে সন্তোষজনক উত্তর পেতে চাইবে। এখন গুগল বা অন্য সার্চ ইঞ্জিন যেভাবে বিভিন্ন লিংক দেখে তথ্য পরিবেশন করে, সে পদ্ধতি বদলে যেতে পারে।
এআইকে পোষ মানানো: ভুয়া ও তথ্য বিভ্রান্তি এড়ানো
জেনারেটিভ এআইয়ের জনপ্রিয়তা নতুন নতুন সম্ভাবনা যেমন সৃষ্টি করেছে, তেমনি এ থেকে ক্ষতি হতে পারে এমন কিছু উদ্বেগও রয়েছে। চ্যাটবটের মাধ্যমে অনেক সময় ভুয়া তথ্য বা ভুয়া উৎসের তথ্য সামনে চলে আসতে পারে। বিভিন্ন ষড়যন্ত্রমূলক তত্ত্ব ও বৈষম্যমূলক তথ্যও সামনে হাজির করতে পারে। এর কাজে পক্ষপাত থাকতে পারে।
এআই বিষয়ে নীতি বিশেষজ্ঞরা বলছেন, এটি টুইটার ও উইকিপিডিয়ার মতো সূত্র থেকে মানুষের নানা তথ্য হাজির করে আনে। এ সময় এআই নানা সমস্যা ও বিভিন্ন পক্ষপাতমূলক বিষয় শিখে যায়। এআই প্রতিষ্ঠানগুলোর পক্ষ থেকে অবশ্য ঠিক করে দেওয়া হয়, কী বলা যাবে বা কী বলা যাবে না। কিন্তু এসব বিধিনিষেধ অনেক সময় কাজ করে না।
কখনো কখনো কৃত্রিম বুদ্ধিমত্তা এমন তথ্য তৈরি করে, যা আপাত বিশ্বাসযোগ্য মনে হয়। কিন্তু তা অপ্রাসঙ্গিক, অর্থহীন বা সম্পূর্ণ মিথ্যা। এআইয়ের এই অদ্ভুত আচরণকে হ্যালুসিনেশন বা বিভ্রম বলা হয়। অনেকে আবার চ্যাটবটে এমন নিমগ্ন হয়ে পড়েছেন, তারা এ সফটওয়্যারকে সংবেদনশীল বলে মনে করে। তাঁরা মনে করেন, এটি চিন্তা করতে পারে। এর অনুভূতি আছে। এটি মানুষের নিয়ন্ত্রণের বাইরে আচরণ করতে পারে। তবে বিশেষজ্ঞরা বলছেন, সফটওয়্যার এখনো সংবেদনশীল নয়। তবে এটি এমন নিখুঁতভাবে কথা বলতে পারে যে একে জীবন্ত বলে ভুল হতে পারে।
কৃত্রিম বুদ্ধিমত্তা ঘিরে আরেকটি দুশ্চিন্তার নাম হচ্ছে ডিপফেক। এটি এমনভাবে ছবি, ভিডিও বা অডিও তৈরি করে যা অবিকল বাস্তব মনে হয়। এই প্রযুক্তি ব্যবহার করে তৈরি ছবি বা ভিডিও বিভ্রান্তি ছড়ানো বা ক্ষতিকর কাজে ব্যবহার করা হতে পারে। এআই নির্মাতারা তাদের মডেলগুলোকে রেড টিমিং নামের বিশেষ মডেল ব্যবহার করে এর ত্রুটিগুলো সারানোর কাজ করে থাকেন। এ পদ্ধতিকে বলা হয় এআইকে পোষ মানানোর পদ্ধতি। তবে এ প্রযুক্তিকে যতোই পোষ মানানোর প্রচেষ্টা চালানো হোক, উদ্ভাবনী শক্তি ও সৃজনশীলতা নিয়ে উদ্বেগ থেকেই যাচ্ছে।
মেশিন লার্নিং বিষয়ের বিশেষজ্ঞ ও জর্জিয়া টেকের কম্পিউটিং বিষয়ের অধ্যাপক মার্ক রিডেল বলেন, যন্ত্র যখন মানুষের মতো আমাদের সঙ্গে কথা বলতে শুরু করে, তখন আমাদের অবিশ্বাস্য মনে হয়। আমরা ধারণা করি, এসব জিনিস আমাদের প্রতি বিশ্বস্ত হওয়ার চেষ্টা করছে। কিন্তু যখন আমরা দেখি, এগুলো কর্তৃত্বপরায়ণ হয়ে উঠছে, তখন সন্দেহ না করে উপায় থাকে না।
চ্যাটবটের দৌড়ে কারা
যুক্তরাষ্ট্রের সানফ্রান্সিসকোভিত্তিক ওপেনএআইয়ের চ্যাটজিপিটির কথা তো সবারই জানা। অলাভজনক প্রতিষ্ঠান হিসেবে আর্টিফিশিয়াল জেনারেল ইনটেলিজেন্স তৈরিতে কাজ শুরু করলেও দ্রুত জনপ্রিয়তা পাওয়ায় ইতিমধ্যে প্রতিষ্ঠানটি করপোরেট ক্ষেত্রের বড় প্রতিষ্ঠান হয়ে উঠেছে। ছবি তৈরির জন্য ডাল-ই ও চ্যাটবট চ্যাটজিপিটি তৈরি করেছে তারা। ইতিমধ্যে মাইক্রোসফট ও সেলসফোর্সের সঙ্গে চুক্তি করেছে তারা।
গুগল আগে থেকে সার্চের ক্ষেত্রে এআই ব্যবহার করে আসছিল। চ্যাটজিপিটি জনপ্রিয় হওয়ায় গুগল বার্ড উন্মুক্ত করেছে। গুগলের ল্যাম্বডা প্রযুক্তি আগে থেকেই চ্যাটবট তৈরির জন্য বিখ্যাত।
মাইক্রোসফট এআই প্রযুক্তির দৌড়ে এগিয়ে থাকতে চায়। তারা ইতিমধ্যে ওপেনএআইয়ে কোটি কোটি ডলার বিনিয়োগ করেছে। এ ছাড়া জিপিটি-৪ প্রযুক্তিনির্ভর বিং চ্যাটবট উন্মুক্ত করেছে। চ্যাটজিপিটি আসার আগেই ফেসবুকের মূল প্রতিষ্ঠান মেটা এআই–নির্ভর ব্লেন্ডারবট নামের একটি চ্যাটবট তৈরি করেছিল। তবে সেটি জনপ্রিয় হয়নি। পরে তাদের এই প্রকল্পের বিজ্ঞানী একে ‘বিরক্তিকর’ বলে মন্তব্য করেছিলেন।