چگونه OpenAI با استاندارد O*NET فعالیت‌ها را طبقه‌بندی می‌کند — نمونه و راهکار بومی پروفایل‌سنتر

,
چگونه OpenAI با استاندارد O*NET فعالیت‌ها را طبقه‌بندی می‌کند

چگونه OpenAI با اتکا به استاندارد O*NET فعالیت‌ها را طبقه‌بندی می‌کند و چرا این برای اکوسیستم مهارت و شغل مهم است؟

مقدمه: وقتی غول‌های فناوری به یک استاندارد تکیه می‌کنند

در سال‌های اخیر، هوش مصنوعی مولد و چت‌بات‌ها به‌سرعت به ابزارهای روزمره میلیون‌ها کاربر تبدیل شده‌اند. اما پشتِ پرده‌ی تحلیل این حجم عظیم از تعاملات، یک سؤال کلیدی وجود دارد: «چطور باید محتوای مکالمات را به زبان فعالیت‌های کاری، مهارت‌ها و وظایف قابل‌فهم برای اقتصاد و بازار کار ترجمه کرد؟» پاسخ OpenAI به این سؤال، اتکا به O*NET (اونِت) است؛ استاندارد مرجع وزارت کار آمریکا برای طبقه‌بندی مشاغل، فعالیت‌ها و وظایف.

OpenAI در یک پژوهش داده‌محور بزرگ‌مقیاس، برای نگاشت محتوای پیام‌های کاربران به فعالیت‌های شغلی، از رده‌بندی‌های چندسطحی O*NET استفاده کرده است.

این انتخاب فقط یک تصمیم فنی نیست؛ پیامی روشن برای اقتصاد داده و صنعت HR-Tech دارد:

O*NET، استانداردی معتبر و عملیاتی است که حتی شرکت‌های پیشرو جهانی نیز برای تحلیل رفتار کاری کاربران و سنجش کارکردهای اقتصادیِ هوش مصنوعی به آن استناد می‌کنند.

در این مقاله، با زبانی شفاف و کاربردی، توضیح می‌دهیم OpenAI دقیقا چگونه از O*NET استفاده کرده، این کار چه ارزش تحلیلی ایجاد می‌کند، نتایج کلیدی چه بوده‌اند، و چرا این‌ها برای سازمان‌ها، مشاوران، دانشگاه‌ها و سیاست‌گذاران مهم است. همچنین نشان می‌دهیم چرا پروفایل‌سنتر به‌عنوان مرجع O*NET فارسی در ایران، حلقه اتصال استاندارد جهانی O*NET با نیازهای بومی ایرانی است.


O*NET چیست و چه مسأله‌ای را حل می‌کند؟

O*NET شبکه اطلاعات شغلی ایالات متحده است که یک «زبان مشترک» برای توصیف مشاغل، وظایف، فعالیت‌های کاری، مهارت‌ها، دانش‌ها و توانایی‌ها فراهم می‌کند. قلب تپنده‌ی O*NET، نظام طبقه‌بندی چندسطحی فعالیت‌های کاری است:

  • Generalized Work Activities یا GWA: فعالیت‌های کاری کلی در سطح بالا (41 مقوله)
  • Intermediate Work Activities یا IWA: فعالیت‌های میانی با دقت بیشتر (332 مقوله)
  • Detailed Work Activities یا DWA: فعالیت‌های جزئی با ریزدانه‌گی بالا (بیش از 2000 مورد)

این سه سطح به پژوهشگران و کسب‌وکارها اجازه می‌دهد هر «متن» یا «رفتار» را به فعالیت‌های کاری استاندارد نگاشت کنند؛ دقیقا همان کاری که OpenAI روی مکالمات ChatGPT انجام داده است.


روش OpenAI برای طبقه‌بندی پیام‌ها با O*NET

OpenAI در یک مطالعه بزرگ (میلیون‌ها مکالمه کاربری)، مجموعه‌ای از طبقه‌بندهای خودکار مبتنی بر LLM را به‌کار گرفته تا پیام‌های کاربران را – با درنظر گرفتن بافت 10 پیام قبل – برچسب‌گذاری کند. یکی از این طبقه‌بندها، نگاشت پیام‌ها به IWAهای O*NET بود و سپس هر IWA به GWA متناظر تجمیع شد.

چند نکته کلیدی در روش‌شناسی OpenAI:

  • پیام‌ها قبل از طبقه‌بندی با «فیلتر حریم خصوصی» از PII پاک‌سازی شده‌اند و هیچ انسانِ پژوهشگری متن خام را ندیده است؛ کل فرایند اتوماتیک و حریم‌خصوصی‌محور بوده است.
  • برای تشخیص «قصد کاربر»، متن پیام و 10 پیام پیشین لحاظ شده تا مفهوم دقیق‌تر استخراج شود.
  • طبقه‌بندی اصلی در سطح IWA انجام و سپس به GWAها تجمیع شده تا تصویر کلانِ فعالیت‌های کاری به‌دست آید.
  • در بخش‌هایی، از «اتاق پاک داده» برای پیوند امنِ طبقه‌بندی‌ها با متغیرهای شغلی-تحصیلی استفاده شده و فقط خروجی‌های تجمیعی با آستانه حداقل 100 کاربر گزارش شده است.

این روش‌شناسی، یک الگوی استاندارد و مقیاس‌پذیر برای تبدیل متن آزادِ مکالمه به داده‌های ساخت‌یافته‌ی قابل تحلیل در اقتصاد کار است.


چه فعالیت‌هایی در مکالمات کاربران غالب است؟ یافته‌های مبتنی بر O*NET

OpenAI پس از نگاشت پیام‌ها به IWA/GWAهای O*NET، به چند واقعیت مهم رسیده است:

  • در کل پیام‌ها:
    • سه GWA مرتبط با «اطلاعات» تقریبا نیمی از همه پیام‌ها را پوشش می‌دهند: «دریافت اطلاعات»، «تفسیر معنای اطلاعات برای دیگران»، و «ثبت/مستندسازی اطلاعات»؛ در مجموع 45.2%.
    • پس از آن «ارائه مشاوره و توصیه»، «تفکر خلاق»، «تصمیم‌گیری و حل مسأله»، و «کار با رایانه» قرار دارند؛ این 7 GWA در مجموع 76.9% پیام‌ها را تشکیل می‌دهند.
  • در پیام‌های مرتبط با کار:
    • «ثبت/مستندسازی اطلاعات»، «تصمیم‌گیری و حل مسأله»، «تفکر خلاق»، «کار با رایانه»، «تفسیر معنای اطلاعات برای دیگران»، «دریافت اطلاعات»، و «ارائه مشاوره/توصیه» غالب‌اند؛ این 7 مورد 57.9% پیام‌های کاری را شکل می‌دهند.
    • نتیجه کلیدی: در محیط کار، دو خوشه فعالیتی بیشترین سهم را دارند: 1) به‌دست‌آوردن، مستندسازی و تفسیر اطلاعات؛ 2) تصمیم‌گیری، ارائه توصیه، حل مسأله و تفکر خلاق.
  • شباهت بین مشاغل:
    • جالب آن‌که این الگوی فعالیت‌ها، «میان‌رشته‌ای» است. حتی در مشاغل بسیار متفاوت، «دریافت اطلاعات» و «تصمیم‌گیری و حل مسأله» جزو پنج فعالیت پرتکرار باقی می‌مانند.
    • بدیهی است که «کار با رایانه» در گروه مشاغل رایانه‌ای، رتبه نخست را دارد، اما در سایر گروه‌ها نیز جزو سبد پرتکرار است.

این نتایج نشان می‌دهد وقتی یک مدل زبانی به زبان O*NET ترجمه می‌شود، ماهیت استفاده‌ی انسان‌ها از چت‌بات‌ها در کار، بیشتر حول «اطلاعات و تصمیم» می‌چرخد تا صرفاً «اتوماسیون کامل وظایف».


چرا نگاشت به O*NET برای تحلیل اقتصادی هوش مصنوعی حیاتی است؟

  • زبان مشترک برای مقایسه شغل‌ها و صنایع: O*NET یک «واژه‌نامه مشترک» می‌سازد تا بتوان خروجی‌های «غیرساخت‌یافته» مانند مکالمه را با «فعالیت‌های کاری استاندارد» مقایسه کرد. حاصل، امکان تحلیل بین‌صنعتی و بین‌شغلی است.
  • سنجش ارزش‌افزوده‌ی واقعی: وقتی بدانیم چه سهمی از مکالمات به «تصمیم‌گیری» و «اطلاعات» مربوط است، بهتر می‌توانیم اثر بهره‌وریِ AI را در مشاغل دانشی اندازه‌گیری کنیم – جایی که کیفیت تصمیم، بهره‌وری را بالا می‌برد.
  • رصد تغییرات مهارت و کار: نگاشت پیام‌ها به IWA/GWAها نشان می‌دهد کدام فعالیت‌ها در حال رشدند. مثلا اگر «ثبت اطلاعات» و «تصمیم‌گیری» رشد کند، می‌توان پیامدهای آن را برای آتیه‌ی آموزش مهارت‌های نرم و تحلیلی رصد کرد.
  • پیوند با سیاست‌گذاری‌های HR: چون O*NET در بسیاری از نظام‌های سیاستگذاری HR در سطح جهانی پذیرفته شده، تحلیل مبتنی بر آن، قابل‌مصرف برای مدیران منابع انسانی، آموزش عالی، نهادهای اشتغال و برنامه‌ریزان ملی است.

فراتر از O*NET: طبقه‌بندی‌های مکمل OpenAI

OpenAI علاوه بر O*NET از چند طبقه‌بندی مکمل استفاده کرده تا تصویر 360 درجه بسازد:

  • «کار/غیرکار»: تشخیص اینکه پیام به کار مربوط است یا نه؛ سهم مکالمات غیرکاری از 53% به بیش از 70% رسیده است.
  • «موضوع مکالمه»: سه موضوع «راهنمایی عملی»، «جست‌وجوی اطلاعات»، و «نگارش» نزدیک به 80% استفاده را تشکیل می‌دهند. در پیام‌های کاری، «نگارش» 40% حجم را دارد.
  • «قصد کاربر – پرسش/انجام/بیان»: حدود 49% «پرسیدن»، 40% «انجام‌دادن»، و 11% «بیان»؛ در پیام‌های کاری، «انجام‌دادن» 56% است و حدود سه‌چهارمِ «انجام‌دادن» به نوشتن مربوط می‌شود.

این طبقه‌بندی‌ها، در کنار O*NET، امکان می‌دهند رفتار کاربران از زوایای مختلف (اقتصادی، مهارتی، کاربردی) دیده شود.


اعتبارسنجی علمی و صیانت از حریم خصوصی

  • طبقه‌بندی‌ها با LLM و بدون مشاهده انسانی بر روی داده خام انجام شده‌اند؛ پیام‌ها قبل از طبقه‌بندی با ابزار خصوصی‌سازی داخلی پاک‌سازی PII شده‌اند.
  • برای برآورد دقت، از داده‌های عمومی WildChat و برچسب‌گذاری انسان استفاده و مقایسه پیمایشی انجام شده است؛ همخوانی نسبتاً بالا برای «کار/غیرکار» و «پرسش/انجام/بیان» و همخوانی متوسط برای «موضوع مکالمه» و O*NET گزارش شده است.
  • تحلیل‌های پیوندی با اطلاعات شغلی-تحصیلی از طریق «اتاق پاک داده» (Data Clean Room) با آستانه‌های تجمیعی سخت‌گیرانه انجام شده است.

نتیجه: یک الگوی مسئولانه که هم روش‌مند است و هم با استانداردهای حریم خصوصی هم‌سو.


نمونه‌هایی از نگاشت پیام به IWA/GWA: از متن آزاد تا فعالیت کاری

OpenAI برای طبقه‌بندی سطح IWA از پرامپت ساخت‌یافته استفاده کرده است. در این پرامپت، مدل باید:

  • «یک» IWA از میان 332 مورد انتخاب کند؛
  • به‌اختصار توضیح دهد چرا این IWA بیشترین انطباق را دارد؛
  • در صورت ابهام، «نامشخص» را برگرداند.

مثال‌ها نشان می‌دهند چطور پرسش‌های عمومی («علل انقلاب فرانسه؟») می‌تواند به IWA مرتبط با «مطالعه اطلاعات تاریخی/سیاسی» نگاشت شود، یا درخواست «رفع باگ کد» به IWAهای حوزه «حل خطاهای برنامه‌نویسی».

این رویکرد، «پل معنایی» بین زبان طبیعی کاربران و «کار واقعی» می‌سازد.


چرا این الگو برای سازمان‌ها و مشاوران منابع انسانی مهم است؟

  • نقشه‌برداری از فعالیت‌های کاری واقعی: اگر شما یک واحد HR هستید، می‌توانید از همین روش برای نگاشت «داده‌های متنی داخلی» (تیکت‌ها، لاگ‌ها، شرح کارها، OKRها، ایمیل‌ها) به O*NET استفاده کنید و بفهمید انرژی سازمان روی کدام فعالیت‌ها مصرف می‌شود: «تصمیم‌گیری؟ ثبت مستندات؟ کار با رایانه؟» چنین بینشی، خوراک تخصیص منابع، بازطراحی شغل و برنامه‌ریزی آموزش است.
  • سنجش Job Fit مبتنی بر فعالیت: با فهم سبد فعالیت‌های غالب هر نقش در سازمان، می‌توانید تناسب شغلی (Job Fit) را دقیق‌تر تعریف کنید و ابزارهای سنجش را هم‌راستا سازید.
  • برنامه‌ریزی آموزش مهارت: اگر تحلیل‌ها نشان بدهد «مستندسازی» و «تصمیم‌گیری» سهم بالایی دارند، سرمایه‌گذاری مهارتی روی «نوشتن حرفه‌ای»، «تحلیل اطلاعات» و «تفکر انتقادی» ارزش بیشتری خواهد داشت.
  • ارزیابی اثر AI: با نگاشت قبل و بعد از استقرار ابزارهای AI به O*NET، می‌توانید تغییر در ترکیب فعالیت‌ها و بهره‌وری را بسنجید و ROI نوآوری را مستند کنید.

پروفایل‌سنتر: مرجع O*NET فارسی در ایران و حلقه اتصال استاندارد جهانی با بوم ایرانی

پروفایل‌سنتر، زیرساخت بومی O*NET فارسی را به‌صورت بانک اطلاعات مشاغل، وب‌سرویس و API ارائه می‌کند و آن را با الگوریتم هوشمند تناسب شغلی (Job Fit) و بانک‌های رشته‌ها و دوره‌ها یکپارچه کرده است. برخی قابلیت‌های کلیدی:

  • دقیق‌ترین نسخه بومی O*NET، با همخوانی با عناوین شغلی تأمین اجتماعی و +210,000 عنوان شغلی.
  • دسترسی از طریق وب‌سرویس و API برای ادغام در سامانه‌های سازمانی.
  • الگوریتم بومی‌شده تناسب شغلی مبتنی بر استاندارد O*NET و آزمون‌های نرمال‌سازی‌شده برای جامعه ایرانی.
  • یکپارچگی با بانک رشته‌های تحصیلی (+3800 رشته-مقطع) و بانک دوره‌های مهارتی (+5700 دوره فنی‌حرفه‌ای)، برای ترجمه «تناسب شغلی» به «نقشه مسیر تحصیلی-مهارتی».

این یعنی همان‌طور که OpenAI از O*NET برای نگاشت فعالیت‌های کاربران استفاده می‌کند، سازمان‌های ایرانی نیز می‌توانند با تکیه بر مرجع O*NET فارسی پروفایل‌سنتر، داده‌های منابع انسانی و فرایندهای ارزیابی خود را به «زبان استاندارد فعالیت‌های کاری» ترجمه کنند و از مزیت‌های تصمیم‌گیری مبتنی‌بر داده بهره‌مند شوند.


موارد استفاده عملی در ایران: از تحلیل داده داخلی تا توسعه مسیر شغلی

  • تحلیل محتوای ارزیابی‌ها و مستندات داخلی سازمان و نگاشت به GWA/IWA برای کشف نقاط گلوگاهی (مثلاً حجم فعالیت‌های «مستندسازی» در مقابل «تصمیم‌گیری»).
  • استفاده از الگوریتم تناسب شغلی برای ارزیابی تأمین نیرو، اولویت‌بندی کارجویان و کاهش خطای استخدام.
  • طراحی برنامه‌های یادگیری و توسعه (L&D) مبتنی بر نیازهای واقعی فعالیتی نقش‌ها؛ پیوند آزمون‌های روان‌سنجی و توانمندی‌ها با پروفایل فعالیت‌های کاری هدف.
  • استعدادیابی تحصیلی-شغلی برای نوجوانان و دانشجویان با ترجمه علاقه‌ها و توانایی‌ها به مسیرهای تحصیلی و فعالیت‌های شغلی استاندارد O*NET.

چرا اتکای شرکت‌های بزرگ به O*NET پیام مهمی برای اکوسیستم HR-Tech دارد؟

وقتی یک بازیگر جهانی مانند OpenAI برای پاسخ به پرسش‌های بنیادین «چه کاری در حال انجام است؟» و «اهمیت اقتصادی آن چیست؟» به O*NET تکیه می‌کند، این سیگنالی قوی است:

  • O*NET فقط یک فهرست شغل نیست؛ یک زبان تحلیلی مشترک برای «فعالیت‌های کاری» است.
  • مقیاس‌پذیر و قابل‌اتکا است: قابلیت نگاشت اتوماتیک و اعتبارسنجی با داده عمومی دارد.
  • پل میان متن آزاد و سیاست‌گذاری/مدیریت منابع انسانی است: خروجی‌ها قابلیت مصرف در HR، آموزش، و تحلیل بهره‌وری را دارند.

سازمان‌ها و پلتفرم‌هایی که از O*NET به‌عنوان ستون فقرات داده استفاده می‌کنند، بهتر می‌توانند اثرات دیجیتالی‌شدن، اتوماسیون و AI را بر کارِ واقعی بسنجند، شکاف مهارتی را بشناسند و مسیرهای توسعه را طراحی کنند.


جمع‌بندی: استاندارد معتبر، الگوی اجرایی، مرجع بومی

  • OpenAI نشان داده که چگونه می‌توان محتوای مکالمات را به «فعالیت‌های کاری استاندارد» نگاشت و از آن برای تحلیل اقتصادی و محصولی استفاده کرد؛ قلب این رویکرد، O*NET است.
  • نتایج بزرگ‌مقیاس این مطالعه تأکید می‌کند که بیشترین ارزش در کارِ دانشی حول «اطلاعات و تصمیم» شکل می‌گیرد و «نوشتن» ستون فقراتِ Doing در محیط کار است.
  • برای ایران، پروفایل‌سنتر مرجع O*NET فارسی و درگاه ادغام این استاندارد با نیازها و الزامات بومی است: وب‌سرویس، بانک مشاغل، الگوریتم تناسب شغلی، بانک رشته و دوره، و اتوماسیون سنجش و مشاوره.

اگر می‌خواهید مانند OpenAI، زبان طبیعی داده‌های خود را به زبان فعالیت‌های کاری قابل‌تصمیم ترجمه کنید، O*NET راه شماست؛ و اگر می‌خواهید این راه را در ایران، فارسی، و یکپارچه با فرایندهای HR و آموزش طی کنید، پروفایل‌سنتر شریک شماست.


دعوت به بررسی و اقدام:

با پروفایل‌سنتر، استاندارد O*NET را به مزیت رقابتی تبدیل کنید.


نویسنده: شهرام ثبوتی پور

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگو شرکت کنید؟
نظری بدهید!

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *