নতুন এআই অডিও মডেল তৈরি করেছে ওপেনএআই, যে সুবিধা পাওয়া যাবে

ওপেনএআইরয়টার্স

কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তিনির্ভর ভয়েস এজেন্টের কার্যকারিতা উন্নত করতে নতুন অডিও মডেল তৈরি করেছে চ্যাটজিপিটির নির্মাতা প্রতিষ্ঠান ওপেনএআই। প্রাথমিকভাবে ডেভেলপারদের জন্য উন্মুক্ত করা মডেলটি কাজে লাগিয়ে এআই ভয়েস এজেন্টগুলোয় বাস্তবসম্মত ও স্বতঃস্ফূর্ত কথোপকথনের সুযোগ পাওয়া যাবে।

প্রযুক্তি–বিশ্লেষকদের মতে, মুখের কথা যোগাযোগের সবচেয়ে স্বাভাবিক মাধ্যম হলেও কৃত্রিম বুদ্ধিমত্তা প্রযুক্তিতে এটি এখনো যথাযথভাবে ব্যবহার করা হচ্ছে না। তবে ওপেনএআইয়ের নতুন উদ্ভাবন এই চিত্র বদলে দিতে পারে। মডেলটিতে থাকা উন্নত স্পিচ-টু-টেক্সট ও টেক্সট-টু-স্পিচ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ভয়েস অ্যাসিস্ট্যান্ট আরও স্বতঃস্ফূর্ত ও কার্যকর হবে। গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যক্তিদের সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।

আরও পড়ুন

ওপেনএআইয়ের নতুন অডিও মডেলটিতে বেশ কয়েকটি গুরুত্বপূর্ণ সুবিধা যুক্ত করা হয়েছে, যার মধ্যে উন্নত স্পিচ-টু-টেক্সট, টেক্সট-টু-স্পিচ মডেলসহ হালানাগাদ এজেন্টস এসডিকে অন্যতম। নতুন স্পিচ-টু-টেক্সট সুবিধা আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল ও দ্রুত কাজ করতে পারে। ফলে বর্তমানের তুলনায় নির্ভুলভাবে মুখের কথাকে লেখায় রূপান্তর করা যাবে। এ ছাড়া এজেন্টস এসডিকের নতুন হালনাগাদের মাধ্যমে ডেভেলপাররা সহজেই লেখাভিত্তিক কৃত্রিম বুদ্ধিমত্তা সহকারীকে কণ্ঠস্বরভিত্তিক ইন্টারঅ্যাকশন সিস্টেমে রূপান্তর করতে পারবেন।

ওপেনএআই দাবি করেছে, নতুন মডেলটি আগের হুইস্পার সংস্করণের তুলনায় আরও নির্ভুল এবং সবচেয়ে কম বিভ্রান্তিকর তথ্য প্রদান করে। এর ফলে গ্রাহকসেবা, ভাষাশিক্ষা এবং বিশেষ চাহিদাসম্পন্ন ব্যবহারকারীদের জন্য সহায়ক প্রযুক্তি হিসেবে মডেলটি নতুন সম্ভাবনার দ্বার উন্মোচন করবে।

সূত্র: ইন্ডিয়ান এক্সপ্রেস