به نظر میرسد که دیگر شاهد شنیدن خبرهای استفاده از یادگیری ماشین در حوزههای مختلفی باشیم. اما استفاده از چنین دانشی کار راحتی نیست. به منظور بهینهسازی الگوریتمها جهت بازشناسی الگوها در دادهها، نیازمند تزریق مقداری زیادی دادهی تگشده به آن هستیم. برای محققین، دو آرشیو عکسی که Google منتشر کرده است، به کار میآید. این دادهها شامل مجموعه دادههای با کیفیت بالا، Open Imageها و YouTube8-M است که همراه با میلیونها لینک ضمیمه شده، جهت استفادهی محققین آماده شده است.
مجموعه عکسهای Open Image از همکاری Google، carnegie Mellon و Cornell فراهم شده است. این مجموعه دارای ۹ میلیون عکسی است که در ابتدا توسط رایانه تگگذاری شده و سپس نوتهای اصلاحی و نهایی توسط انسان روی آن صورت گرفته است. تیم تحقیق Google میگوید به اندازهی کافی عکس جهت آموزش شبکهی عصبی از پایه داشته است. بنابراین اگر طرح تحقیقاتی مبتنی بر هوش مصنوعی مورد نظرتان بود، دادههای Google محل رجوع بسیار مناسبی است.
در آن سو، YouTube8-M دارای ۸ میلیون ویدئو است که این گروه میگوید نسبت به گذشته شاهد رشد فزایندهای بوده است. ایدهای که اینجا مطرح هست، ایجاد کتابخانهای از ویدئوها جهت آنالیز است، بهطوری که مجموعه دادههای پیشین موجود و قابل دسترس برای عموم را به چالش بکشد. قسمتی از دلیل آن به این خاطر است که Google تصاویر ساکن را دریافت و تگگذاری کرده و برای دانلود محققین قرار داده است. اگر شما میخواهید بر روی هوشمصنوعی خودروی بدون سرنشین کار کنید و یا چیزی سادهتر، میتوانید پایگاهداده چنین مجموعهای را از طریق این لینک دسترسی داشته باشید.
مجموعه عکسهای Open Image از همکاری Google، carnegie Mellon و Cornell فراهم شده است. این مجموعه دارای ۹ میلیون عکسی است که در ابتدا توسط رایانه تگگذاری شده و سپس نوتهای اصلاحی و نهایی توسط انسان روی آن صورت گرفته است. تیم تحقیق Google میگوید به اندازهی کافی عکس جهت آموزش شبکهی عصبی از پایه داشته است. بنابراین اگر طرح تحقیقاتی مبتنی بر هوش مصنوعی مورد نظرتان بود، دادههای Google محل رجوع بسیار مناسبی است.
در آن سو، YouTube8-M دارای ۸ میلیون ویدئو است که این گروه میگوید نسبت به گذشته شاهد رشد فزایندهای بوده است. ایدهای که اینجا مطرح هست، ایجاد کتابخانهای از ویدئوها جهت آنالیز است، بهطوری که مجموعه دادههای پیشین موجود و قابل دسترس برای عموم را به چالش بکشد. قسمتی از دلیل آن به این خاطر است که Google تصاویر ساکن را دریافت و تگگذاری کرده و برای دانلود محققین قرار داده است. اگر شما میخواهید بر روی هوشمصنوعی خودروی بدون سرنشین کار کنید و یا چیزی سادهتر، میتوانید پایگاهداده چنین مجموعهای را از طریق این لینک دسترسی داشته باشید.