چگونه OpenAI با استاندارد O*NET فعالیتها را طبقهبندی میکند — نمونه و راهکار بومی پروفایلسنتر
چگونه OpenAI با اتکا به استاندارد O*NET فعالیتها را طبقهبندی میکند و چرا این برای اکوسیستم مهارت و شغل مهم است؟
مقدمه: وقتی غولهای فناوری به یک استاندارد تکیه میکنند
در سالهای اخیر، هوش مصنوعی مولد و چتباتها بهسرعت به ابزارهای روزمره میلیونها کاربر تبدیل شدهاند. اما پشتِ پردهی تحلیل این حجم عظیم از تعاملات، یک سؤال کلیدی وجود دارد: «چطور باید محتوای مکالمات را به زبان فعالیتهای کاری، مهارتها و وظایف قابلفهم برای اقتصاد و بازار کار ترجمه کرد؟» پاسخ OpenAI به این سؤال، اتکا به O*NET (اونِت) است؛ استاندارد مرجع وزارت کار آمریکا برای طبقهبندی مشاغل، فعالیتها و وظایف.
OpenAI در یک پژوهش دادهمحور بزرگمقیاس، برای نگاشت محتوای پیامهای کاربران به فعالیتهای شغلی، از ردهبندیهای چندسطحی O*NET استفاده کرده است.
این انتخاب فقط یک تصمیم فنی نیست؛ پیامی روشن برای اقتصاد داده و صنعت HR-Tech دارد:
O*NET، استانداردی معتبر و عملیاتی است که حتی شرکتهای پیشرو جهانی نیز برای تحلیل رفتار کاری کاربران و سنجش کارکردهای اقتصادیِ هوش مصنوعی به آن استناد میکنند.
در این مقاله، با زبانی شفاف و کاربردی، توضیح میدهیم OpenAI دقیقا چگونه از O*NET استفاده کرده، این کار چه ارزش تحلیلی ایجاد میکند، نتایج کلیدی چه بودهاند، و چرا اینها برای سازمانها، مشاوران، دانشگاهها و سیاستگذاران مهم است. همچنین نشان میدهیم چرا پروفایلسنتر بهعنوان مرجع O*NET فارسی در ایران، حلقه اتصال استاندارد جهانی O*NET با نیازهای بومی ایرانی است.
O*NET چیست و چه مسألهای را حل میکند؟
O*NET شبکه اطلاعات شغلی ایالات متحده است که یک «زبان مشترک» برای توصیف مشاغل، وظایف، فعالیتهای کاری، مهارتها، دانشها و تواناییها فراهم میکند. قلب تپندهی O*NET، نظام طبقهبندی چندسطحی فعالیتهای کاری است:
- Generalized Work Activities یا GWA: فعالیتهای کاری کلی در سطح بالا (41 مقوله)
- Intermediate Work Activities یا IWA: فعالیتهای میانی با دقت بیشتر (332 مقوله)
- Detailed Work Activities یا DWA: فعالیتهای جزئی با ریزدانهگی بالا (بیش از 2000 مورد)
این سه سطح به پژوهشگران و کسبوکارها اجازه میدهد هر «متن» یا «رفتار» را به فعالیتهای کاری استاندارد نگاشت کنند؛ دقیقا همان کاری که OpenAI روی مکالمات ChatGPT انجام داده است.
روش OpenAI برای طبقهبندی پیامها با O*NET
OpenAI در یک مطالعه بزرگ (میلیونها مکالمه کاربری)، مجموعهای از طبقهبندهای خودکار مبتنی بر LLM را بهکار گرفته تا پیامهای کاربران را – با درنظر گرفتن بافت 10 پیام قبل – برچسبگذاری کند. یکی از این طبقهبندها، نگاشت پیامها به IWAهای O*NET بود و سپس هر IWA به GWA متناظر تجمیع شد.
چند نکته کلیدی در روششناسی OpenAI:
- پیامها قبل از طبقهبندی با «فیلتر حریم خصوصی» از PII پاکسازی شدهاند و هیچ انسانِ پژوهشگری متن خام را ندیده است؛ کل فرایند اتوماتیک و حریمخصوصیمحور بوده است.
- برای تشخیص «قصد کاربر»، متن پیام و 10 پیام پیشین لحاظ شده تا مفهوم دقیقتر استخراج شود.
- طبقهبندی اصلی در سطح IWA انجام و سپس به GWAها تجمیع شده تا تصویر کلانِ فعالیتهای کاری بهدست آید.
- در بخشهایی، از «اتاق پاک داده» برای پیوند امنِ طبقهبندیها با متغیرهای شغلی-تحصیلی استفاده شده و فقط خروجیهای تجمیعی با آستانه حداقل 100 کاربر گزارش شده است.
این روششناسی، یک الگوی استاندارد و مقیاسپذیر برای تبدیل متن آزادِ مکالمه به دادههای ساختیافتهی قابل تحلیل در اقتصاد کار است.
چه فعالیتهایی در مکالمات کاربران غالب است؟ یافتههای مبتنی بر O*NET
OpenAI پس از نگاشت پیامها به IWA/GWAهای O*NET، به چند واقعیت مهم رسیده است:
- در کل پیامها:
- سه GWA مرتبط با «اطلاعات» تقریبا نیمی از همه پیامها را پوشش میدهند: «دریافت اطلاعات»، «تفسیر معنای اطلاعات برای دیگران»، و «ثبت/مستندسازی اطلاعات»؛ در مجموع 45.2%.
- پس از آن «ارائه مشاوره و توصیه»، «تفکر خلاق»، «تصمیمگیری و حل مسأله»، و «کار با رایانه» قرار دارند؛ این 7 GWA در مجموع 76.9% پیامها را تشکیل میدهند.
- در پیامهای مرتبط با کار:
- «ثبت/مستندسازی اطلاعات»، «تصمیمگیری و حل مسأله»، «تفکر خلاق»، «کار با رایانه»، «تفسیر معنای اطلاعات برای دیگران»، «دریافت اطلاعات»، و «ارائه مشاوره/توصیه» غالباند؛ این 7 مورد 57.9% پیامهای کاری را شکل میدهند.
- نتیجه کلیدی: در محیط کار، دو خوشه فعالیتی بیشترین سهم را دارند: 1) بهدستآوردن، مستندسازی و تفسیر اطلاعات؛ 2) تصمیمگیری، ارائه توصیه، حل مسأله و تفکر خلاق.
- شباهت بین مشاغل:
- جالب آنکه این الگوی فعالیتها، «میانرشتهای» است. حتی در مشاغل بسیار متفاوت، «دریافت اطلاعات» و «تصمیمگیری و حل مسأله» جزو پنج فعالیت پرتکرار باقی میمانند.
- بدیهی است که «کار با رایانه» در گروه مشاغل رایانهای، رتبه نخست را دارد، اما در سایر گروهها نیز جزو سبد پرتکرار است.
این نتایج نشان میدهد وقتی یک مدل زبانی به زبان O*NET ترجمه میشود، ماهیت استفادهی انسانها از چتباتها در کار، بیشتر حول «اطلاعات و تصمیم» میچرخد تا صرفاً «اتوماسیون کامل وظایف».
چرا نگاشت به O*NET برای تحلیل اقتصادی هوش مصنوعی حیاتی است؟
- زبان مشترک برای مقایسه شغلها و صنایع: O*NET یک «واژهنامه مشترک» میسازد تا بتوان خروجیهای «غیرساختیافته» مانند مکالمه را با «فعالیتهای کاری استاندارد» مقایسه کرد. حاصل، امکان تحلیل بینصنعتی و بینشغلی است.
- سنجش ارزشافزودهی واقعی: وقتی بدانیم چه سهمی از مکالمات به «تصمیمگیری» و «اطلاعات» مربوط است، بهتر میتوانیم اثر بهرهوریِ AI را در مشاغل دانشی اندازهگیری کنیم – جایی که کیفیت تصمیم، بهرهوری را بالا میبرد.
- رصد تغییرات مهارت و کار: نگاشت پیامها به IWA/GWAها نشان میدهد کدام فعالیتها در حال رشدند. مثلا اگر «ثبت اطلاعات» و «تصمیمگیری» رشد کند، میتوان پیامدهای آن را برای آتیهی آموزش مهارتهای نرم و تحلیلی رصد کرد.
- پیوند با سیاستگذاریهای HR: چون O*NET در بسیاری از نظامهای سیاستگذاری HR در سطح جهانی پذیرفته شده، تحلیل مبتنی بر آن، قابلمصرف برای مدیران منابع انسانی، آموزش عالی، نهادهای اشتغال و برنامهریزان ملی است.
فراتر از O*NET: طبقهبندیهای مکمل OpenAI
OpenAI علاوه بر O*NET از چند طبقهبندی مکمل استفاده کرده تا تصویر 360 درجه بسازد:
- «کار/غیرکار»: تشخیص اینکه پیام به کار مربوط است یا نه؛ سهم مکالمات غیرکاری از 53% به بیش از 70% رسیده است.
- «موضوع مکالمه»: سه موضوع «راهنمایی عملی»، «جستوجوی اطلاعات»، و «نگارش» نزدیک به 80% استفاده را تشکیل میدهند. در پیامهای کاری، «نگارش» 40% حجم را دارد.
- «قصد کاربر – پرسش/انجام/بیان»: حدود 49% «پرسیدن»، 40% «انجامدادن»، و 11% «بیان»؛ در پیامهای کاری، «انجامدادن» 56% است و حدود سهچهارمِ «انجامدادن» به نوشتن مربوط میشود.
این طبقهبندیها، در کنار O*NET، امکان میدهند رفتار کاربران از زوایای مختلف (اقتصادی، مهارتی، کاربردی) دیده شود.
اعتبارسنجی علمی و صیانت از حریم خصوصی
- طبقهبندیها با LLM و بدون مشاهده انسانی بر روی داده خام انجام شدهاند؛ پیامها قبل از طبقهبندی با ابزار خصوصیسازی داخلی پاکسازی PII شدهاند.
- برای برآورد دقت، از دادههای عمومی WildChat و برچسبگذاری انسان استفاده و مقایسه پیمایشی انجام شده است؛ همخوانی نسبتاً بالا برای «کار/غیرکار» و «پرسش/انجام/بیان» و همخوانی متوسط برای «موضوع مکالمه» و O*NET گزارش شده است.
- تحلیلهای پیوندی با اطلاعات شغلی-تحصیلی از طریق «اتاق پاک داده» (Data Clean Room) با آستانههای تجمیعی سختگیرانه انجام شده است.
نتیجه: یک الگوی مسئولانه که هم روشمند است و هم با استانداردهای حریم خصوصی همسو.
نمونههایی از نگاشت پیام به IWA/GWA: از متن آزاد تا فعالیت کاری
OpenAI برای طبقهبندی سطح IWA از پرامپت ساختیافته استفاده کرده است. در این پرامپت، مدل باید:
- «یک» IWA از میان 332 مورد انتخاب کند؛
- بهاختصار توضیح دهد چرا این IWA بیشترین انطباق را دارد؛
- در صورت ابهام، «نامشخص» را برگرداند.
مثالها نشان میدهند چطور پرسشهای عمومی («علل انقلاب فرانسه؟») میتواند به IWA مرتبط با «مطالعه اطلاعات تاریخی/سیاسی» نگاشت شود، یا درخواست «رفع باگ کد» به IWAهای حوزه «حل خطاهای برنامهنویسی».
این رویکرد، «پل معنایی» بین زبان طبیعی کاربران و «کار واقعی» میسازد.
چرا این الگو برای سازمانها و مشاوران منابع انسانی مهم است؟
- نقشهبرداری از فعالیتهای کاری واقعی: اگر شما یک واحد HR هستید، میتوانید از همین روش برای نگاشت «دادههای متنی داخلی» (تیکتها، لاگها، شرح کارها، OKRها، ایمیلها) به O*NET استفاده کنید و بفهمید انرژی سازمان روی کدام فعالیتها مصرف میشود: «تصمیمگیری؟ ثبت مستندات؟ کار با رایانه؟» چنین بینشی، خوراک تخصیص منابع، بازطراحی شغل و برنامهریزی آموزش است.
- سنجش Job Fit مبتنی بر فعالیت: با فهم سبد فعالیتهای غالب هر نقش در سازمان، میتوانید تناسب شغلی (Job Fit) را دقیقتر تعریف کنید و ابزارهای سنجش را همراستا سازید.
- برنامهریزی آموزش مهارت: اگر تحلیلها نشان بدهد «مستندسازی» و «تصمیمگیری» سهم بالایی دارند، سرمایهگذاری مهارتی روی «نوشتن حرفهای»، «تحلیل اطلاعات» و «تفکر انتقادی» ارزش بیشتری خواهد داشت.
- ارزیابی اثر AI: با نگاشت قبل و بعد از استقرار ابزارهای AI به O*NET، میتوانید تغییر در ترکیب فعالیتها و بهرهوری را بسنجید و ROI نوآوری را مستند کنید.
پروفایلسنتر: مرجع O*NET فارسی در ایران و حلقه اتصال استاندارد جهانی با بوم ایرانی
پروفایلسنتر، زیرساخت بومی O*NET فارسی را بهصورت بانک اطلاعات مشاغل، وبسرویس و API ارائه میکند و آن را با الگوریتم هوشمند تناسب شغلی (Job Fit) و بانکهای رشتهها و دورهها یکپارچه کرده است. برخی قابلیتهای کلیدی:
- دقیقترین نسخه بومی O*NET، با همخوانی با عناوین شغلی تأمین اجتماعی و +210,000 عنوان شغلی.
- دسترسی از طریق وبسرویس و API برای ادغام در سامانههای سازمانی.
- الگوریتم بومیشده تناسب شغلی مبتنی بر استاندارد O*NET و آزمونهای نرمالسازیشده برای جامعه ایرانی.
- یکپارچگی با بانک رشتههای تحصیلی (+3800 رشته-مقطع) و بانک دورههای مهارتی (+5700 دوره فنیحرفهای)، برای ترجمه «تناسب شغلی» به «نقشه مسیر تحصیلی-مهارتی».
این یعنی همانطور که OpenAI از O*NET برای نگاشت فعالیتهای کاربران استفاده میکند، سازمانهای ایرانی نیز میتوانند با تکیه بر مرجع O*NET فارسی پروفایلسنتر، دادههای منابع انسانی و فرایندهای ارزیابی خود را به «زبان استاندارد فعالیتهای کاری» ترجمه کنند و از مزیتهای تصمیمگیری مبتنیبر داده بهرهمند شوند.
موارد استفاده عملی در ایران: از تحلیل داده داخلی تا توسعه مسیر شغلی
- تحلیل محتوای ارزیابیها و مستندات داخلی سازمان و نگاشت به GWA/IWA برای کشف نقاط گلوگاهی (مثلاً حجم فعالیتهای «مستندسازی» در مقابل «تصمیمگیری»).
- استفاده از الگوریتم تناسب شغلی برای ارزیابی تأمین نیرو، اولویتبندی کارجویان و کاهش خطای استخدام.
- طراحی برنامههای یادگیری و توسعه (L&D) مبتنی بر نیازهای واقعی فعالیتی نقشها؛ پیوند آزمونهای روانسنجی و توانمندیها با پروفایل فعالیتهای کاری هدف.
- استعدادیابی تحصیلی-شغلی برای نوجوانان و دانشجویان با ترجمه علاقهها و تواناییها به مسیرهای تحصیلی و فعالیتهای شغلی استاندارد O*NET.
چرا اتکای شرکتهای بزرگ به O*NET پیام مهمی برای اکوسیستم HR-Tech دارد؟
وقتی یک بازیگر جهانی مانند OpenAI برای پاسخ به پرسشهای بنیادین «چه کاری در حال انجام است؟» و «اهمیت اقتصادی آن چیست؟» به O*NET تکیه میکند، این سیگنالی قوی است:
- O*NET فقط یک فهرست شغل نیست؛ یک زبان تحلیلی مشترک برای «فعالیتهای کاری» است.
- مقیاسپذیر و قابلاتکا است: قابلیت نگاشت اتوماتیک و اعتبارسنجی با داده عمومی دارد.
- پل میان متن آزاد و سیاستگذاری/مدیریت منابع انسانی است: خروجیها قابلیت مصرف در HR، آموزش، و تحلیل بهرهوری را دارند.
سازمانها و پلتفرمهایی که از O*NET بهعنوان ستون فقرات داده استفاده میکنند، بهتر میتوانند اثرات دیجیتالیشدن، اتوماسیون و AI را بر کارِ واقعی بسنجند، شکاف مهارتی را بشناسند و مسیرهای توسعه را طراحی کنند.
جمعبندی: استاندارد معتبر، الگوی اجرایی، مرجع بومی
- OpenAI نشان داده که چگونه میتوان محتوای مکالمات را به «فعالیتهای کاری استاندارد» نگاشت و از آن برای تحلیل اقتصادی و محصولی استفاده کرد؛ قلب این رویکرد، O*NET است.
- نتایج بزرگمقیاس این مطالعه تأکید میکند که بیشترین ارزش در کارِ دانشی حول «اطلاعات و تصمیم» شکل میگیرد و «نوشتن» ستون فقراتِ Doing در محیط کار است.
- برای ایران، پروفایلسنتر مرجع O*NET فارسی و درگاه ادغام این استاندارد با نیازها و الزامات بومی است: وبسرویس، بانک مشاغل، الگوریتم تناسب شغلی، بانک رشته و دوره، و اتوماسیون سنجش و مشاوره.
اگر میخواهید مانند OpenAI، زبان طبیعی دادههای خود را به زبان فعالیتهای کاری قابلتصمیم ترجمه کنید، O*NET راه شماست؛ و اگر میخواهید این راه را در ایران، فارسی، و یکپارچه با فرایندهای HR و آموزش طی کنید، پروفایلسنتر شریک شماست.
دعوت به بررسی و اقدام:
- مشاهده بانک O*NET فارسی و دسترسی API
- آشنایی با الگوریتم تناسب شغلی پروفایلسنتر و کاربردهای سازمانی: «نرمافزار کانون ارزیابی و استخدام» و «اتوماسیون سنجش و مشاوره»
- یکپارچهسازی مسیرهای تحصیلی و دورههای مهارتی با شایستگیهای شغلی: «بانک اطلاعات رشتههای دانشگاهی» و «بانک دورههای فنی-حرفهای»
با پروفایلسنتر، استاندارد O*NET را به مزیت رقابتی تبدیل کنید.
نویسنده: شهرام ثبوتی پور
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگو شرکت کنید؟نظری بدهید!