بده و بستان از نوع دیجیتالی
گوشی را برمی دارم و یک پیغام صوتی می گذارم: "لطفاً به من زنگ بزن. فوری است." واقعاً با کسی کاری ندارم، بلکه برای تست Google Voice، که یک ابزار تلفن اینترنتی است و از هوش مصنوعی برای تبدیل پیام های صوتی به متن استفاده می کند، به خودم زنگ زده ام. این نرم افزار ظرف یک دقیقه نتیجه را به ایمیل شما می فرستد.
در زمان انتظار به وب سایت ترجمه زبان Babel Fish متعلق به یاهو رفتم و همان پیام را برای ترجمه به روسی در آن تایپ کردم. سپس با تلفن هوشمندم عکسی از دفترچه یادداشت و قلمی که روی میزم بود گرفتم و برای جستجوی تصاویر مشابه به موتور جستجوی آنلاین تصاویر Goggles App گوگل فرستادم. این کار را برای آزمایش هوش مصنوعی این ابزارها که در میان ابزارهای دارای هوش مصنوعی فعلی از بهترین ها هستند، انجام دادم.
نتایج اصلاً هیجان انگیز نیستند. Google Voice از پیام صوتی من این یادداشت را برداشته است: "لطفاً به من زنگ بزن در جلسه." ترجمه مجدد روسی سایت Babel Fish نیز بهتر از این نیست: "لطفاً به من یک زنگوله بده. فوری است." تصاویر پیشنهادی Goggles نیز واقعاً عجیب اند. به جای تصاویر لوازم اداری که انتظار می رفت ارائه دهد، نرم افزار یک نقاشی مربوط به دوره رنسانس و یک نقاشی ماهی به عنوان نتیجه جستجو بازگرداند.
هوش مصنوعی امروزی هنوز به سختی در تلاش است تا موفق به تکمیل کارهایی گردد که انسان ها به سادگی انجام می دهند. اما راه حلی هوشمندانه برای غلبه بر این کمبودها در حال ظهور است که می تواند نوع رابطه ما با ماشین ها را دگرگون سازد. اگر هوش مصنوعی با مسأله ای مواجه شود که قادر به حل آن نیست، می تواند به سراغ اینترنت برود، جایی که هزاران انسان منتظر کمک رسانی به او هستند. برخی برای پول این کار را انجام می دهند و برخی دیگر برای تفریح. در واقع این احتمال وجود دارد که شما پیش از این بدون اینکه متوجه شده باشید ماشینی را در انجام وظایفش یاری رسانده باشید. ما در حال خلق هوش های ترکیبی (Hybrid Intelligences) هستیم که می توانند در تمامی زمینه ها کارآیی بهتری از هوش مصنوعی استاندارد داشته باشند.
بنابراین شاید زمان آن رسیده باشد که نگاهی دوباره به تصویر داستان های علمی تخیلی از دستیاران خودمختار با قوه تفکر کاملاً مصنوعی بیاندازیم. هوشمندترین ماشین های آینده ممکن است "آدم های ماشینی معکوس" (هوش مصنوعی که به وسیله ما انسانها تکمیل می شود) یعنی تلفیقی از برنامه نویسی، ترانزیستور و توان ذهنی لشگری از کارکنان انسانی باشند.
هوش مصنوعی همه جا هست ولی با وضعیت مطلوب فاصله زیادی دارد. کامپیوترها می توانند اشیاء معمولی را در صورت نوردهی مناسب تشخیص دهند یا کلمات ادا شده توسط یک خبر خوان را بفهمند، اما زندگی واقعی به این زیبایی نیست. زبان روزمره ما مملو از بازی با کلمات، استعارات و ضرب المثل ها است. ما به لهجه های متفاوتی سخن می گوییم و مکرراً با اشیاء و محیط های ناآشنا مواجه می شویم. تا زمانی که هوش مصنوعی نتواند بر این چالش ها فائق شود، اهداف آن مانند ربات های دستیار یک رویای فانتزی باقی خواهند ماند. اگر ماشین نفهمد چه می گویید یا نتواند بی خطر در محیط حرکت کند چگونه می توانید انتظار داشته باشید ظرف ها را درون ماشین ظرفشویی قرار دهد؟
ایده کمک گرفتن از انسان ها برای غلبه بر کمبودهای هوش مصنوعی حداقل به سال 2001 باز می گردد، زمانی که لوییس فون آن، دانشمند علوم کامپیوتر در دانشگاه کارنگی ملون در پیتزبورگ ایالت پنسیلوانیا، برای ملاقات با نامزدش در حال سفری هوایی بود. او با نگاهی به ردیف صندلی های هواپیما متوجه شد تمام حواس مسافرین مشغول انجام کاری مشکل بود: حل جدول روزنامه.
او می گوید: "مردمی را دیدم که علاقمند به انجام کاری هستند که کامپیوترها نمی توانند انجام دهند." البته مشخص شد این حرف فون آن کاملاً هم درست نبوده و کامپیوترها می توانند برخی از انواع جدول را حل کنند. اما این ایده در ذهنش باقی ماند. اگر می توانست کارهایی را طراحی کند که انسان ها مایل به انجام آنها باشند، موفق می شد کاری کند که انسان ها به ماشین ها کمک کنند.
اولین پروژه های فون آن "بازی هایی هدفمند" بودند. مثلاً در بخشی از بازی ESP او، بازیکنان بدون شناخت هویت هم گروهی شان به گروه هایی تقسیم می شدند. آنها در صورتی امتیاز می گرفتند که هر دو عضو گروه برای تصویری که به آنها ارائه می شد، عنوان یک کلمه ای یکسانی را انتخاب می کردند. آنها برای تفریح این کار را می کردند ولی بدون اینکه بدانند به نرم افزارهای بینایی ماشین کمک می کردند که یاد بگیرند همان نوع اشیاء را تشخیص دهند. اصطلاحی که فون آن برای این شیوه اختراع کرد "جمعیت سپاری" (Crowdsourcing) بود.
او سپس از جمعیت برای دیجیتال کردن کتاب ها و نشریات استفاده کرد. کامپیوترها برای تبدیل حروف چاپی به متون دیجیتال از تکنیکی به نام تشخیص نوری حروف (OCR) استفاده می کنند ولی این شیوه در صورت تار بودن یا اعوجاج حروف به سادگی دچار اشتباه می شود. اما ما در حین مرور اینترنت مرتباً از کلمات تار رمز گشایی می کنیم. هنگام افتتاح حساب در سایت هایی مانند خدمات ایمیل که نیاز به ثبت نام دارند، از شما خواسته می شود تا یک متن کج و معوج به نام Captcha را بخوانید. هدف از این کار به اشتباه انداختن نرم افزارهای خودکار مورد استفاده فرستندگان هرزنامه است فون آن فهمید که از این کار می توان برای غلبه بر یکی از نقایص هوش مصنوعی استفاده کرد.
نتیجه که reCAPTCHA نام داشت سال 2007 عرضه شد. این نرم افزار با استفاده از OCR صفحات را بررسی می کند اما وقتی به بخشی از متن رسید که برایش قابل تشخیص نبود درخواست کمک می کند. او آن بخش از متن را به Captchaهای خاصی در تعداد زیادی از وب سایت ها (از جمله newscientist.com) می فرستد. آنها از کاربر می خواهند این متن را به همراه متن کج و معوج دیگری که قبلاً دیجیتال شده است، رمز گشایی کنند. اگر کاربر دومی را به درستی تشخیص دهد، نرم افزار فرض می کند که اولی را هم درست تشخیص داده است. فون آن می گوید: " مقیاس خیلی بزرگ است. روزانه 100 میلیون Captcha انجام می شود." کاملاً محتمل است که شما هم پیش از این با انجام یکی از این Captchaها توان ذهنی تان را در اختیار یک هوش ترکیبی بزرگ تر قرار داده باشید.
هم زمان با کار فون آن بر روی reCaptcha که نقطه عطف رایانش انسانی دانسته می شود، آمازون نیز سرویسی را ارائه کرد که ساخت سیستم های آدم ماشینی وار دیگری را امکان پذیر می کرد. در اوایل دهه اول قرن، غول خرده فروشی آنلاین به اندازه ای بزرگ شده بود که برای تشخیص اقلام تکراری در فهرست محصولاتش به دنبال راهی بهتر می گشت.
خودکارسازی این وظیفه مشکل بود، بنابراین شرکت بخش بزرگی از کار را به افراد آنلاین خارج از شرکت سپرد. در نتیجه این موفقیت بود که آمازون در سال2005 سیستم Mechanical Turk را عرضه کرد که به همگان اجازه می داد از مهارت های تعداد بسیار زیادی نیروی انسانی استفاده کنند. این سیستم برای شرکت هایی که کارهایی مانند بازنویسی نیز از وظایف شان بود کمکی بزرگ به حساب می آمد. آنها متوجه شدند می توانند کارهایشان را به مراتب ارزان تر انجام دهند (ن.ک. بیگاری دیجیتال در ادامه مطلب). اما کاربردهای جاه طلبانه تری نیز برای آن پیدا شد. محققین علاقمند به رایانش انسانی اکنون ارتشی از این افراد در اختیار دارند. نتیجه مجموعه ای از ترکیب های انسان - ماشین است که براساس کار ابتکاری فون آن و دیگران ساخته شده اند.
برخی از پروژه ها تلفیقی هوشمندانه از انسان و ماشین ایجاد می کنند. ایده دور از انتظار ترجمه بدون استفاده از مترجمان دو زبانه را در نظر بگیرید. این ایده که Monotrans نامیده می شود حاصل کار فیلیپ رزنیک و بن بدرسن از دانشگاه مریلند در کالج پارک است. یک روس و یک اسپانیایی را تصور کنید که هیچ کدام نمی توانند به زبان دیگری صحبت کنند. نرم افزار Monotrans جملات آنها را برای یکدیگر ترجمه می کند، ترجمه ای که به طور اجتناب ناپذیری ناقص است. اما پس از هر ترجمه طرف روس یا اسپانیایی با ویرایش متن آن را واضح تر می کند و دوباره ترجمه می شود. رزنیک و بدرسون می گویند معمولاً 3 بار رفت و برگشت برای رسیدن به ریک ترجمه با کیفیت کافی است. آنها اضافه می کنند که دو کاربر باید بتوانند در نهایت روزانه 1000 کلمه را ترجمه کنند.
مزیت دیگر Mechanical Turk سرعت است. ارتش ها معمولاً هزاران عضو دارند، در نتیجه گاهی ممکن است کارها ظرف چند ثانیه انجام شوند. این سرعت پاسخ در سال 2008 به کارگروهی از متخصصین علوم اعصاب دانشگاه برکلی کالیفرنیا که می خواستند یک سیستم هوشمند تشخیص اشیاء بسازند، آمد. آنها شرکتی به نام IQ Engine تأسیس کردند و امید اولیه آنها این بود که بتوانند سیستم تشخیص اشیایی بسازند که از همان شیوه های سیستم بصری مغز استفاده کند. مغز پیش از ورود به جزئیات پیچیده، ابتدا ویژگی های اولیه صحنه مانند گوشه های اشیاء را پردازش می کند. پیر گاریگز مدیر تحقیقات شرکت می گوید: "خیلی زود متوجه شدیم که بینایی کامپیوتر برای ساخت چنین محصولی مناسب نیست."
محصول نهایی IQ Engine نرم افزار موبایلی به نام oMoby است که سال گذشته عرضه شد. این نرم افزار میان فناوری تشخیص اشیاء شرکت و قدرت جمعی انسان ها پیوند برقرار می کند. کاربران با نرم افزاری که بر روی گوشی های هوشمندشان است عکس می گیرند. سپس نرم افزار اولین تلاش خود را برای تشخیص تصویر انجام می دهد. اگر سیستم موفق نبود تصویر را به Mechanical Turk یا وب سایت خود شرکت می فرستد. گاریگز می گوید زمان پاسخ ها متفاوت است ولی کارکنان می توانند به بیش از نیمی از جستجوها در کمتر از 25 ثانیه پاسخ دهند.
این نرم افزار برای کمک به افرادی با بینایی ضعیف به اندازه کافی مناسب است. دارل سندرو، دانشجوی دانشگاه ایالتی آریزونا در فینیکس که تقریباً نابینا است می گوید: "چشمان تان را ببندید و تصور کنید چگونه باید اشیاء درون آشپزخانه را تشخیص دهید. می توانم جعبه ها، قوطی ها و شیشه های مختلف را لمس کنم. در بسیاری از موارد می توانم تشخیص دهم که چه چیزی در دست دارم. اما همیشه این کار ممکن نیست. چه جور غلاتی درون جعبه است؟ قوطی های کنسرو را چطور تشخیص دهم؟ با استفاده از oMoby موفق شدم صرفه جویی زیادی در وقت بکنم. کافی است یک عکس بگیرم و 30 ثانیه یا شاید 1 دقیقه صبر کنم تا پاسخ را دریافت کنم." فناوری مشابهی می تواند به حرکت ماشین های هوشمند کمک کند. مثلاً در Willow Garage که یک شرکت سازنده ربات در پالوآلتوی کالیفرنیا است، مهندسانی که بر روی رباتی به نام PR2 کار می کنند تجربه ساخت دستگاهی را داشته اند که وقتی با شیئی غیر قابل تشخیص روبرو می شود از Mechanical Turk کمک می گیرد.
اما اگر هوش مصنوعی بخواهد واقعاً بهره مند شود باید سرعت پاسخ جمعی افزایش یابد. کار مایکل برنستین از مؤسسه فناوری ماساچوست را در نظر بگیرید. او یک نرم افزار عکاسی مبتنی بر هوش جمعی برای گوشی های هوشمند ساخت. هدف این برنامه کمک به افراد برای گرفتن عکس از لحظات گذرا مثل اتفاقات ورزشی است. در این حالت به جای اینکه همیشه انگشت کاربر بر روی دکمه شاتر آماده باشد، می تواند به طور مداوم از صحنه فیلم بگیرد تا لحظه مهم فرا رسد. سپس تصاویر گرفته شده به Mechanical Turk ارسال می شود تا کارکنان بهترین فریم را انتخاب کنند. برنستین برای حصول اطمینان از اینکه در هر لحظه کارکنانی را داشته باشد، برای هر دقیقه انتظار تا 5 دقیقه به آنها نیم سنت می دهد. او در آزمایشات اولیه به این نتیجه رسید که اولین کارکنان کار بر روی ویدیو را 2 ثانیه پس از دریافت آغاز می کنند.
شاید در چند سال آینده تأخیر کارهای دیگر نیز به همین کوتاهی شود و کیفیت نیز افزایش یابد. با افزایش فروش گوشی های هوشمند افراد بیشتر و بیشتری در مکان های گوناگون از نرم افزارهای هوش مصنوعی با قابلیت جمعیت سپاری استفاده خواهند کرد. تا زمانی که انگیزه پول یا تفریح وجود دارد (ن.ک. نمودارهای فوق)، همیشه یک نفر هست که به ماشین کمک کند.
سختگیرترین رئیس
هیچ دلیلی وجود ندارد که ماشین ها نتوانند از نیروی کار ماشین های دیگر نیز استفاده کنند. در نهایت ممکن است دریایی از کارگران - برخی انسان و برخی سیلیکونی - داشته باشیم که 24 ساعت در روز و 7 روز در هفته آماده کار باشند. دافنه شاهاف از دانشگاه کارنگی ملون و اریک هورویتز از آزمایشگاه تحقیقاتی مایکروسافت در ردموند واشنگتن، سال گذشته کارکرد چنین وضعی را که آنها بازار کارهای همگانی (GTM) می نامند، تشریع کردند. ایده، ساخت نرم افزاری بود که کارهای پیچیده را با در نظر گرفتن مهارت و هزینه هر کارگر به طور خودکار میان تعداد کثیری از انسان ها و ماشین ها تقسیم کند. آن دو برای اثبات اصل، نمونه ای از GTM به نام Lingua Mechanica ساختند که کارهای ترجمه زبان را انجام می دهد. اما هورویتز بلند پروازی های بلندمدت رادیکال تری داشت.
تصور کنید کودکی گم شده است. یک الگوریتم یافتن گمشده ها در GTM فعال خواهد شد. این الگوریتم می تواند در وب به دنبال عکس هایی که اخیراً از مسیر خانه کودک گرفته شده اند بگردد. یا داوطلبانی را به خدمت گیرد که به عنوان شبکه ای از حسگرهای انسانی در منطقه مورد جستجو عمل کنند و تصاویر گرفته شده با گوشی های هوشمند خود را گزارش کنند. یک الگوریتم جستجوی دیگر می تواند با مطالعه گزارشات خبری و تویتر به دنبال شواهد تصادفات باشد. تمامی اینها بدون حضور یک هماهنگ کننده انسانی انجام می شوند.
GTM می تواند گستره کاربرد فوق العاده ای داشته باشد. در زمان فاجعه هایی مانند نشت نفت، GTM می تواند متخصصین، داده ها و ربات ها را گردآوری کند. این سیستم حتی می تواند پروژه های ابرترجمه مانند ترجمه کل ویکی پدیا به زبان های جدید را مدیریت کند. هورویتز می گوید: "GTM می تواند با بررسی مجموعه بزرگی از هوش ها، برای حل مسأله توری از افراد و ماشین ها ببافد."
البته ممکن است همه تغییراتی که اهدای توان ذهنی ما در یک هوش ترکیبی ایجاد می کند هم خوب نباشد. ابداع پلت فرم های جمعیت سپاری می تواند نیروی کار جهانی را به دو دسته تقسیم کند: آنهایی که کامپیوترهای ارسال کننده کار را برنامه نویسی می کنند و آنهایی که عملاً برنامه نویسی می شوند. کارگران فقط کارهای تخصیص یافته را انجام می دهند و از اهداف گسترده تر کارفرمایانشان اطلاعی ندارند. بنابراین اگر از GTM یا الگوریتمی دیگر برای ارتکاب جرم استفاده شود، چه اتفاقی می افتد؟ آیا مسئولیتی متوجه کارگران خواهد بود؟ در حال حاضر نیز برخی از فرستندگان هرزنامه بدافزارهایی طراحی کرده اند که وقتی با Captchaهایی مواجه می شوند که نمی توانند بخوانند، آنها را برای کارگرانی در کشورهای در حال توسعه می فرستند. احتمالاً آنها شرکت کنندگان را فریب می دهند. اما الزاماً هم این طور نیست.
هم اکنون فرصت بحث در مورد مسایل اخلاقی رایانش انسانی را داریم ولی شاید زمان زیادی تا همه گیر شدن این آدم های ماشینی معکوس باقی نمانده باشد. Mechanical Turk تنها 6 سال دارد و از عمر جمعیت سپاری نیز خیلی بیش از این نمی گذرد. در این زمان کوتاه ترکیب انسان - کامپیوتر نشان از پتانسیل هایی وسوسه کننده داشته است. ممکن است به زودی خود را در حالی بیابید که به چشم های یک ربات خیره شده اید در حالی که میلیون ها چشم انسان در پشت صحنه به شما خیره شده اند.
بیگاری دیجیتال
آیا حاضرید با 1 دلار در ساعت کار کنید؟ هزاران کاربر آنلاین این کار را می کنند. امروزه اگر می خواهید کاری انجام شود ساده ترین راه مراجعه به کارگران آنلاین است. می توانید کاری را در وب سایت Mechanical Turk آگهی و در ازای آن مبلغی را پیشنهاد کنید. کسانی از گوشه و کنار جهان پیدا می شوند که آن را برایتان انجام دهند.
یک مطالعه نشان می دهد که میانگین پرداختی در این پلت فرم 1.40 دلار در ساعت است. حداقل حقوق طبق قانون فدرال ایالات متحده که تقریباً نیمی از این کارگران را به خود اختصاص داده، 7.25 دلار در ساعت است. اما این سرویس آنقدرها هم که در ابتدا به نظر می رسد بیگاری کشیدن نیست. مطالعه کارگران آمریکایی سیستم نشان می دهد که بیشتر آنها در اوقات فراقت خود به این کار می پردازند. بسیاری از آنها تحصیل کرده هستند و گزارش کرده اند که انجام این کارها لذت قابل قبولی دارد و روش خوبی برای کسب کمی درآمد بیشتر است. یک سوم آنها نیز در هند زندگی می کنند که بسیاری از افراد در مشاغل معمول درآمدی کمتر از 1.40 دلار در ساعت دارند.
کارهای آنلاین هنوز شامل تدابیر لازم برای حفاظت از حقوق کارکنان نیستند. مدافعیت حقوق کارکنان مدت ها است برای شمول این تدابیر در قانون مبارزه می کنند. بیشتر کارگران برنامه های جمعیت سپاری فاقد حداقل دفاع در برابر بدرفتاری کارفرما هستند و فرصتی نیز برای ارتقای شغلی یا چانه زنی در مورد دستمزد در اختیار ندارند.