مدتها قبل از ظهور ChatGPT، دولتها مایل بودند از چتباتها برای خودکارسازی خدمات و مشاورههای خود استفاده کنند. کالین ون نوردت، محققی در مورد استفاده از هوش مصنوعی در دولت و مستقر در هلند، میگوید: آن چتباتهای اولیه سادهتر و با تواناییهای مکالمه محدود بودند. اما ظهور هوش مصنوعی مولد در دو سال گذشته، چشمانداز خدمات عمومی کارآمدتر را احیا کرده است، که در آن مشاوران انسانمانند میتوانند تمام ساعتها کار کنند و به سؤالات مربوط به مزایا، مالیاتها و سایر حوزههایی که دولت با مردم در تعامل است پاسخ دهند. هوش مصنوعی مولد به اندازه کافی پیچیده است که بتواند پاسخ هایی شبیه به انسان بدهد، و اگر بر روی داده های با کیفیت کافی آموزش ببیند، از نظر تئوری می تواند با انواع سؤالات در مورد خدمات دولتی پاسخ دهد. اما هوش مصنوعی مولد به دلیل اشتباهات یا حتی پاسخهای بیمعنی – به اصطلاح توهم – شناخته شده است.
در بریتانیا، سرویس دیجیتال دولتی (GDS) آزمایشاتی را روی یک ربات چت مبتنی بر ChatGPT به نام GOV.UK Chat انجام داده است که به سؤالات شهروندان در مورد طیف وسیعی از مسائل مربوط به خدمات دولتی پاسخ می دهد. در یک پست وبلاگ در مورد یافته های اولیه خود، آژانس خاطرنشان کرد که تقریباً 70٪ از کسانی که در کارآزمایی شرکت داشتند، پاسخ ها را مفید دانستند. با این حال، «چند» مواردی از سیستم تولید اطلاعات نادرست و ارائه آن به عنوان واقعیت وجود داشت. این وبلاگ همچنین نگرانی هایی را مطرح کرد که ممکن است اعتماد نابجا به سیستمی وجود داشته باشد که ممکن است گاهی اوقات اشتباه باشد.
“به طور کلی، پاسخ ها به بالاترین سطح دقت مورد نیاز برای سایتی مانند GOV.UK، که در آن دقت واقعی بسیار مهم است، نمی رسد. ما به سرعت در حال تکرار این آزمایش هستیم تا به مسائل مربوط به دقت و قابلیت اطمینان رسیدگی کنیم.”
کشورهای دیگر نیز در حال آزمایش سیستم های مبتنی بر هوش مصنوعی مولد هستند.
پرتغال راهنمای عملی عدالت را در سال 2023 منتشر کرد، یک ربات چت که برای پاسخ به سؤالات اساسی در مورد موضوعات ساده مانند ازدواج و طلاق ابداع شده است. ربات چت با کمک های مالی موسسه بازیابی و تاب آوری اتحادیه اروپا (RRF) توسعه یافته است. پروژه 1.3 میلیون یورویی (1.4 میلیون دلار؛ 1.1 میلیون پوند) بر اساس مدل زبان GPT 4.0 OpenAI است. علاوه بر پوشش ازدواج و طلاق، اطلاعاتی در مورد راه اندازی یک شرکت نیز ارائه می دهد. بر اساس داده های وزارت دادگستری پرتغال، 28608 سوال از طریق راهنما در 14 ماه اول پروژه مطرح شده است. وقتی از آن سوال اساسی پرسیدم: “چگونه می توانم یک شرکت راه اندازی کنم”، عملکرد خوبی داشت. اما وقتی چیز پیچیدهتری پرسیدم: «اگر کمتر از 18 سال سن دارم، اما متاهل هستم، میتوانم شرکتی راهاندازی کنم؟»، به دلیل نداشتن اطلاعات برای پاسخ به این سؤال عذرخواهی کرد. یک منبع وزارت اذعان می کند که آن ها هنوز از نظر قابل اعتماد نیستند، حتی اگر پاسخ های اشتباه نادر است.
این منبع به من می گوید: “ما امیدواریم با افزایش قاطع در سطح اطمینان پاسخ ها بر این محدودیت ها غلبه شود.”
اگر ChatGPT و دیگر مدلهای زبان بزرگ (LLM) آماده ارائه توصیههای مهم نیستند، شاید بتوانیم برای جایگزینی به استونی نگاه کنیم. هنگامی که صحبت از دیجیتالی کردن خدمات عمومی به میان می آید، استونی یکی از پیشروها بوده است. از اوایل دهه 1990 این شرکت خدمات دیجیتالی ایجاد کرده است و در سال 2002 کارت شناسایی دیجیتالی را معرفی کرد که به شهروندان امکان دسترسی به خدمات دولتی را می دهد.
بنابراین جای تعجب نیست که استونی در خط مقدم معرفی چت بات ها قرار دارد. کشور در حال حاضر در حال توسعه مجموعه ای از چت بات ها برای خدمات دولتی با نام Bürokratt است. با این حال، رباتهای چت استونی بر اساس مدلهای زبان بزرگ (LLM) مانند ChatGPT یا Gemini گوگل نیستند. در عوض آن ها از پردازش زبان طبیعی (NLP) استفاده می کنند، فناوری که قبل از آخرین موج هوش مصنوعی بود. الگوریتمهای NLP استونی یک درخواست را به بخشهای کوچک تقسیم میکنند، کلمات کلیدی را شناسایی میکنند و از آن استنباط میکنند که کاربر چه میخواهد.
در Bürokratt، بخشها از دادههای خود برای آموزش رباتهای گفتگو و بررسی پاسخهای آنها استفاده میکنند. کای کالاس، رئیس بخش خدمات شخصی در اداره سیستم اطلاعات استونی میگوید: «اگر Bürokratt پاسخ را نداند، چت به نماینده پشتیبانی مشتری تحویل داده میشود، که چت را به عهده میگیرد و به صورت دستی پاسخ میدهد. این یک سیستم با پتانسیل محدودتر از سیستم مبتنی بر ChatGPT است، زیرا مدل های NLP در توانایی خود برای تقلید گفتار انسان و تشخیص نکات ظریف در زبان محدود هستند. با این حال، بعید است که پاسخ های اشتباه یا گمراه کننده بدهند.
کالین ون نوردت توضیح میدهد: «برخی از چتباتهای اولیه شهروندان را مجبور میکردند گزینههایی را برای سؤالات انتخاب کنند. در همان زمان، کنترل و شفافیت بیشتری در نحوه عملکرد و پاسخهای ربات چت فراهم میکرد».
چت ربات های مبتنی بر LLM اغلب کیفیت مکالمه ای بسیار بیشتری دارند و می توانند پاسخ های ظریف تری را ارائه دهند. او می افزاید: «با این حال، هزینه کنترل کمتر سیستم را به همراه دارد و همچنین می تواند پاسخ های متفاوتی به یک سوال ارائه دهد.