পডকাস্টার রায়ান ঝাও হিসেবে ব্লুস্কিতে রাখুন“ডিজাইন প্রক্রিয়াটি ভুল হয়ে গেছে যখন আপনার প্রোটোটাইপ করার জন্য যা প্রয়োজন তা হল ‘একটি জায়গা থাকলে কী হবে’।”
দ্রুত যেতে হবে
গুগল যখন এই বছরের শুরুতে জিনির প্রথম সংস্করণ প্রকাশ করেছিল, তখন এটিও একটি বিস্তারিত গবেষণা পত্র প্রকাশ করেছে মডেলকে প্রশিক্ষণ দেওয়ার জন্য পর্দার আড়ালে নেওয়া সুনির্দিষ্ট পদক্ষেপের রূপরেখা এবং কীভাবে সেই মডেল ইন্টারেক্টিভ ভিডিও তৈরি করেছে। Genie 2 এর প্রক্রিয়ার বিশদ বিবরণ দিয়ে এমন কোনও গবেষণাপত্র প্রকাশিত হয়নি, যা আমাদের কিছু গুরুত্বপূর্ণ বিবরণে অনুমান করে রেখেছিল।
এই বিবরণগুলির মধ্যে সবচেয়ে গুরুত্বপূর্ণ হল মডেলের গতি। প্রথম জিনি মডেলটি প্রতি সেকেন্ডে মোটামুটি এক ফ্রেমে তার বিশ্ব তৈরি করেছিল, এমন একটি হার যা রিয়েল টাইমে সহনীয়ভাবে খেলার যোগ্য হওয়ার চেয়ে ধীর গতির আদেশ ছিল। Genie 2 এর জন্য, Google শুধুমাত্র বলে যে “এই ব্লগ পোস্টের নমুনাগুলি একটি আনডিস্টিলড বেস মডেল দ্বারা তৈরি করা হয়েছে, যা সম্ভব তা দেখানোর জন্য। আমরা আউটপুটগুলির গুণমান হ্রাসের সাথে রিয়েল-টাইমে একটি পাতিত সংস্করণ খেলতে পারি।”
লাইনের মধ্যে পড়া, মনে হচ্ছে Genie 2-এর সম্পূর্ণ সংস্করণটি সেই চটকদার GIFs দ্বারা নিহিত রিয়েল-টাইম ইন্টারঅ্যাকশনের নীচে কিছু কাজ করে। রিয়েল-টাইম কন্ট্রোলে মডেলের একটি মিশ্রিত সংস্করণ পেতে কতটা “গুণমান হ্রাস” প্রয়োজনীয় তা অস্পষ্ট, তবে Google দ্বারা উপস্থাপিত উদাহরণের অভাবের কারণে, আমাদের ধরে নিতে হবে যে হ্রাস উল্লেখযোগ্য।
রিয়েল-টাইম, ইন্টারেক্টিভ এআই ভিডিও জেনারেশন ঠিক একটি পাইপ স্বপ্ন নয়। চলতি বছরের শুরুতে এআই মডেল নির্মাতা মো ডেকার্ট এবং হার্ডওয়্যার নির্মাতা খোদাই করা প্রকাশিত মরুদ্যান মডেলএকটি মানব-নিয়ন্ত্রণযোগ্য, AI-উত্পাদিত ভিডিও ক্লোন দেখাচ্ছে মাইনক্রাফ্ট যা প্রতি সেকেন্ডে পূর্ণ 20 ফ্রেমে চলে। যাইহোক, সেই 500 মিলিয়ন প্যারামিটার মডেলকে একটি একক, তুলনামূলকভাবে সহজ গেমের লক্ষ লক্ষ ঘন্টার ফুটেজের উপর প্রশিক্ষণ দেওয়া হয়েছিল এবং সেই গেমের অন্তর্নিহিত ক্রিয়াকলাপ এবং পরিবেশগত ডিজাইনের সীমিত সেটের উপর একচেটিয়াভাবে ফোকাস করা হয়েছিল।
যখন Oasis চালু হয়, তখন এর নির্মাতারা “ডোমেন সাধারণীকরণের সাথে লড়াই করে” মডেলটিকে পুরোপুরি স্বীকার করে, শুরুর দৃশ্যগুলি কীভাবে “বাস্তববাদী” দেখায় সরলীকরণে হ্রাস করতে হয়েছিল মাইনক্রাফ্ট ব্লক ভাল ফলাফল অর্জন করতে। এবং এমনকি সেই সীমাবদ্ধতার সাথেও, এটি করা কঠিন নয় ফুটেজ খুঁজুন মরুদ্যান ভয়ঙ্কর দুঃস্বপ্নের জ্বালানীতে অধঃপতন মাত্র কয়েক মিনিট খেলার পর।