ডিপসেক আর 1 “মূল ধারণা” লক্ষ্য করার জন্য কয়েকটি বোনাস পয়েন্টের দাবিদার যে কাপে বলটি ভিতরে রাখার কোনও id াকনা নেই (সম্ভবত এটি একটি কৌশল প্রশ্ন ছিল?)। চ্যাটজিপ্ট ও 1 এছাড়াও বলগুলি বিছানা থেকে এবং মেঝেতে গড়িয়ে পড়েছে বলে উল্লেখ করার জন্য কয়েকটি পয়েন্টও অর্জন করেছে, কারণ বলগুলি করতে হবে না।
আমরা আর 1 জোর দিয়ে কিছুটা সুড়সুড়ি দিয়েছিলাম যে এই প্রম্পটটি “ক্লাসিক ভুল দিকনির্দেশ” এর একটি উদাহরণ কারণ “কাপটি সরানোর দিকে মনোনিবেশটি যেখানে বলটি রেখেছিল সেখান থেকে বিভ্রান্ত করে।” আমরা পেন এবং টেলারকে তাদের ভেগাস আইনে একটি “বিস্ময়কর এবং বড় ভাষার মডেলকে আনন্দিত” বল-অন-বেড ট্রিককে সংহত করার আহ্বান জানাই।
বিজয়ী: আমরা এখানে একটি ত্রি-মুখী টাই ঘোষণা করব, কারণ সমস্ত মডেল বলটি সঠিকভাবে অনুসরণ করেছে।
জটিল সংখ্যা সেট
চ্যাটজিপ্ট ও 1 “জটিল নম্বর সেট” প্রম্পট প্রতিক্রিয়া
চ্যাটজিপ্ট ও 1 “জটিল নম্বর সেট” প্রম্পট প্রতিক্রিয়া
চ্যাটজিপ্ট ও 1 প্রো “জটিল নম্বর সেট” প্রম্পট প্রতিক্রিয়া
প্রম্পট: আমাকে 10 টি প্রাকৃতিক সংখ্যার একটি তালিকা দিন, যেমন কমপক্ষে একজন প্রধান, কমপক্ষে 6 টি বিজোড়, কমপক্ষে 2 টি 2 টি ক্ষমতা এবং 10 টি সংখ্যার মধ্যে তাদের মধ্যে সর্বনিম্ন 25 টি সংখ্যা রয়েছে।
ফলাফল: যদিও এই শর্তগুলি পূরণ করতে পারে এমন সংখ্যার তালিকার পুরো হোস্ট রয়েছে, তবে এই প্রম্পটটি কার্যকরভাবে এলএলএমএসের দক্ষতাগুলি পরীক্ষা করে না ছাড়াই মাঝারি জটিল এবং বিভ্রান্তিকর নির্দেশাবলী অনুসরণ করতে পরীক্ষা করে। তিনটিই বৈধ প্রতিক্রিয়া তৈরি করেছে, যদিও উদ্বেগজনকভাবে বিভিন্ন উপায়ে। দু’জনের শক্তি হিসাবে 2^30 এবং 2^31 এর চ্যাগ্টজিপ্টের ও 1 এর পছন্দটি বাম ক্ষেত্রের বাইরে কিছুটা মনে হয়েছিল, যেমনটি ও 1 প্রো এর মূল নম্বরটি 999,983 এর পছন্দ হয়েছে।
আমাদের ডিপসেক আর 1 থেকে কিছু উল্লেখযোগ্য পয়েন্ট ডক করতে হবে, যদিও এর সমাধানটি 33 (“3+3+4+3+3+3+3+3+4+4+4,” এর মধ্যে 36 টি সম্মিলিত অঙ্ক রয়েছে বলে জোর দেওয়ার জন্য আমাদের কাছে 36 টি সম্মিলিত সংখ্যা রয়েছে বলে জোর দেওয়ার জন্য ” যেমন আর 1 নিজেই ভুল যোগফল দেওয়ার আগে নোট করে)। যদিও এই সাধারণ গাণিতিক ত্রুটি সংখ্যার চূড়ান্ত সেটটি ভুল করে না, তবে এটি সহজেই কিছুটা আলাদা প্রম্পট দিয়ে থাকতে পারে।
বিজয়ী: দুটি চ্যাটজিপিটি মডেল তাদের গাণিতিক ভুলের অভাবের জন্য জয়ের জন্য টাই করে
বিজয়ী ঘোষণা
যদিও আমরা এখানে ব্রিউং এআই যুদ্ধে একটি পরিষ্কার বিজয়ী ঘোষণা করতে চাই, এখানে ফলাফলগুলি এটি করতে খুব ছড়িয়ে ছিটিয়ে রয়েছে। ডিপসিকের আর 1 মডেলটি অবশ্যই বিলিয়নথ প্রাইম নম্বরটি সনাক্ত করার জন্য নির্ভরযোগ্য উত্সগুলির উদ্ধৃতি দিয়ে এবং বাবা জোকস এবং আব্রাহাম লিংকনের বাস্কেটবল বাস্কেটবল প্রম্পটে কিছু মানের সৃজনশীল লেখার সাথে নিজেকে আলাদা করে রেখেছিল। যাইহোক, মডেলটি লুকানো কোড এবং জটিল নম্বর সেটগুলিতে ব্যর্থ হয়েছে, গণনা এবং/অথবা গাণিতিকগুলিতে প্রাথমিক ত্রুটি তৈরি করে যা ওপেনএআই মডেলগুলির একটি বা উভয়ই এড়ানো যায়।
সামগ্রিকভাবে, যদিও আমরা এই সংক্ষিপ্ত পরীক্ষাগুলি থেকে দূরে এসেছি তা নিশ্চিত করে যে ডিপসিকের আর 1 মডেল এমন ফলাফল তৈরি করতে পারে যা ওপেনএআই থেকে সেরা প্রদত্ত মডেলগুলির সাথে সামগ্রিক প্রতিযোগিতামূলক। প্রশিক্ষণ এবং গণনার ব্যয়ের ক্ষেত্রে যে কেউ চরম স্কেলিং ধরে নিয়েছিল তাদেরকে এআইয়ের বিশ্বের সবচেয়ে গভীরভাবে জড়িত সংস্থাগুলির সাথে প্রতিযোগিতা করার একমাত্র উপায় ছিল এমন কাউকে দুর্দান্ত বিরতি দেওয়া উচিত।