وب معنایی

مقاله به بحث درباره موج آینده توسعه شبکه جهانی وب، موسوم به وب معنایی می پردازد. وب معنایی شیوه ای برای ایجاد یک وب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. مقاله به اجمال به توصیف پنج سطح وب معنایی می پردازد شامل: 1) آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)؛ 2) فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.){تعریف نوع سند(دی.ان.اس.)}/ فرانمای چارچوب وصیف منبع (آر.دی.اف)؛ 3) واژگان- هستی شناسی؛ 4)قواعد- منطق و برهان؛ 5)امنیت- اطمینان. مقاله با این نتیجه خاتمه می یابد که بایستی وب سایت های خود را به عنوان جزئی از یک کل در نظر بگیریم، نه در انزوا از دیگر سایت ها.

کلید واژه ها :وب معنایی

متن مقاله :

مقدمه

در حالیکه به نظر می رسد با فروکش کردن موج دات کام ها {سایت های تجاری.م.} ، بخشی از انقلاب اینترنت خاتمه یافته است، انقلاب خاموش دیگری در وب در حال وقوع است. وب تا کنون درمسیر تولید، ورود، ذخیره و نمایش اطلاعات موفق بوده است، اما بازیابی و پردازش هنوز به عنوان یک مشکل باقی است.

موج اول پیشرفت وب شامل ارائه حداکثر اطلاعات ممکن به شکلی بود که بتواند به صورت مستقیم در قالب زبان نشانه گذاری فرامتن (HTML)برای مخاطب نمایش داده شود. بانک های اطلاعاتی هر روز بیش از پیش تلاش می کنند اطلاعات را به شکلی تولید نمایند که قبل از نمایش برای کاربر، توسط دیگر رایانه ها قابل خواندن و پردازش باشد. آنها برای برچسب گذاری داده ها، به جای HTML از زبان نشانه گذاری توسعه پذیر (XML) بهره می برند و برخی از آنها به منظور استاندارد سازی قالب محتوا به نحوی که صرف نظر از کاربرد نهایی، توسط رایانه ها نیز قابل خواندن باشد به استفاده از چارچوب توصیف سند (RDF) روی آورده اند.

در موج جدید پیشرفت تلاش می شود تا هر شیی اطلاعاتی موجود در جهان اطلاعات به واسطه موضوع، محل، پدیدآورنده، تاریخ و دیگر ویژگی هایش توصیف شود. این نوع اطلاعات پیشتر تنها در یک بانک اطلاعاتی ذخیره می شد اما اکنون ممکن است در یک سند ذخیره شود.
وجه تمایز میان یک پیشینه در یک پایگاه اطلاعاتی و یک سند هر روز کم رنگ تر می شود. اطلاعات ممکن است در ابربرچسب (Metatag) ها در راس یک صفحه HTML قرار گیرد یا یک سند کامل ممکن است با استفاده از XML با بخش های مفصل نظیر عنوان، چکیده، روش ها، و نتایج کدگذاری شود.

این موج تازه پیشرفت را "وب معنایی"( Semantic web) می نامند. وب معنایی شیوه ای است برای ایجاد یک وب که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. این امر ممکن است از بازیابی اسناد گرفته تا جمع بندی عناصر برنامه ای مختلف برای خلق یک نرم افزار کاربردی را دربر گیرد. تیم برنرزلی (Tim Berners-Lee) {ابداع کننده وب معنایی.م.}عقاید خود را درباره این امکانات در { http://www.w3.org/2000/talks/1206-xml2k-tbl }مطرح کرده است.

وب معنایی شامل پنج سطح است:
1. آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (URI) ،
2. فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (XML Schema) {تعریف نوع سند(DTD) }/ فرانمای چاچوب توصیف منبع (RDF Schema) ،
3. واژگان- هستی شناسی،
4. قواعد- منطق و برهان،
5. امنیت- اطمینان.

در حالیکه بسیاری از این عناصر پیشاپیش پیرامون وب وجودداشته اند، فناوری هایی که امکان بکارگیری منسجم آنها را فراهم می کند به تازگی عرضه شده اند. محدودیت های اصلی این رهیافت بیشتر از عوامل انسانی نشأت می گیرد تا از فناوری.

آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)

نقطه آغاز برای اطلاعات وب، آدرس منحصر به فرد آن است- اما آیا واقعاً منحصر به فرد است؟ ما با مکان نماهای متحدالشکل منبع (URL) به عنوان شیوه توصیف محل ها آشنا هستیم اما با ایجاد تغییر در اسامی حوزه ها و بسته شدن سایت ها، نشانگرهای منحصر به فرددیگری اتخاذ می شوند نظیر نشانگر دیجیتالی شئی (DOI) یا یو.آر.ال ثابت (برای جزئیات بیشتر نگاه کنید به http://www.purl.org). راه حل های گوناگونی وجود دارد، این موارد را می توان به صورت کلی تر به عنوان URI ها توصیف کرد که این مزیت رادارند که اگر آدرس وب نهایی تغییر کند، URI هنوز به محلی اشاره می کند که نهایتاً به محل اصلی منبع منتهی می شود.

فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.)/ فرانمای چاچوب توصیف منبع (آر.دی.اف)

زبان نشانه گذاری توسعه پذیر قبلاً در مقاله دیگری توصیف شده است(1). تولید برونداد در قالب XML ازیک بانک اطلاعاتی چه به عنوان یک صفحه وب ثابت یا یک نتیجه جستجوی پویا امر بسیار ساده ایست. این برونداد می تواند توسط یک برنامه کاربردی دیگر مورد استفاده قرر گیرد و امکان تبادل، ترکیب یا پردازش داده ها را فراهم نماید (برای جزئیات نگاه کنید به http://www.xml.org).

XML شیوه ای برای برچسب گذاری داده هاست. با این حال نیازمند یک فرانما (طرح) برای اعتبار بخشی به محتوای برچسب (Tag) هایی است که هر جزء از داده ها را توصیف می کنند. پدیدآورنده، عنوان و سال ممکن است به عنوان برچسب در سندی که توسط یک فرانما یا تعریف نوع سند (DTD) توصیف شده است درج شوند. زبان نشانه گذاری توسعه بین المللی (IDML) می تواند مثال خوبی باشد (برای اطلاعات بیشتر نگاه کنید به http://www.idmlinitiative.org/).
مادامیکه به سمت یک نظام خودکار که در آن رایانه ها داده ها را تعبیر می کنند پیش می رویم، لازم است برچسب هایی برای کنترل پردازش داده ها و اطمینان از استاندارد سازی محتوا وجود داشته باشد؛ این همان جایی است که آر.دی.اف اهمیت می یابد. آر.دی.اف یک استاندارد است که گاه برای تبادل داده میان بانک های اطلاعاتی مورد استفاده قرار می گیرد.
یکی دیگر ازسیستم های کدگذاری که برای کمک به تبادل محتوا به زبان های مختلف ایجاد شده است، Unicode است. یونی کد استانداردی است برای مشخص نمودن حروفی که خارج از مجموعه کدهای ASCII قرار دارند. یونی کد یک استاندارد جهانی برای نمایش حروف و علائم فراهم نموده و تبادل ساده آنها با دیگر برنامه های کاربردی را بدون بروز اشکال در مورد حروف دارای اکسان (علائم صوتی) میسر می نماید (برای جزئیات بیشتر نگاه کنید به http://www.unicode.org/).

واژگان- هستی شناسی

این مبحث، هم به واژگان رایانه نظیر واژگان مورد استفاده برای خدمت دهنده های اینترنت جهت برقراری ارتباط و تبادل اطلاعات ارتباط می یابد و هم به مفاهیمی که گروه های فعال درحوزه های موضوعی مختلف جهت تعریف حوزه موضوعی شان بکار می برند.. هر دو مورد برای اطمینان از بازیابی و نمایش اسناد یا داده های مرتبط در هنگام جستجوی کاربر به زبان طبیعی ضرورت دارند. مراحل دخیل دراین امر نه تنها شامل عبارت جستجوی ارسال شده به بانک های اطلاعاتی مختلف جهت دریافت پاسخ می شود بلکه اهمیت برقراری پیوند میان واژگان در زبان ها و رشته های مختلف را نیز دربر می گیرد.

قواعد- منطق و برهان

قواعدی که رایانه با اتکا به آنها به بازیابی داده ها از طیفی از منابع می پردازد در واقع همان Script ها و برنامه های نرم افزاری هستند. برخی بر این باورند که این قواعد بایستی به مرحله ای از تکامل برسند که به صورت خودکار به عنوان مثال افزایش دستمزد ها را در یک شرکت بر مبنای برآورد فروش یا تولید در اینترانت آن شرکت کنترل کنند؛ اما شاید هم در جهان علمی، اعتبار، برگرفته از گزارش ها یا نوشته های افراداست نه رایانه.

امنیت- اطمینان

در حالت واقعی، اگر چه ایده یک وب یکپارچه ممکن است جذاب به نظر برسد، اما هر روز بیش از پیش با محدودسازی وب از طریق ایجاد رمز عبور برای وب سایت ها مواجه می شویم. اطلاعات به طور معمول میان یک گروه از شرکت ها یا یک کنسرسیوم از سازمان ها به اشتراک گذاشته می شود. تجربه شخصی من این است که در مورد همکاری با سازمان های وابسته به سازمان ملل و بانک جهانی، اگر قرار باشد آنها با گردآوری انبوه اطلاعات یک نظام مرکزی تدارک ببینند، تردید وجود دارد. جایی که یک تعاونی یا کنسرسیوم از سازمان ها پیرامون امنیت یا نفع مشترک گرد هم می آیند، رهیافت اشتراک داده ها موفق تر است. فناوری های جدید شیوه هایی جهت وصول اطمینان از تضمین امنیت اطلاعات فراهم می کنند. به طبع، دراین صورت کاربر نیز اطمینان و اعتماد بیشتری به داده ها و نظام پیدا می کند. در نتیجه نهایتاً با مجموعه ای از وب ها مواجه خواهیم بود که از اطمینان لازم برای کاربردهای مختلف توسط گروه های متفاوت برخوردار هستند. این شبکه ها نسبت به نظام های موجود که مبتنی بر یک سازمان فراهم کننده محتوا هستند، خدمات بهتری می توانند ارائه کنند.

وب معنایی چگونه بر نظام شما اثر می گذارد؟

همه گروه های فراهم کننده اطلاعات روی وب پیشاپیش با انتخاب ابربرچسب های بکار رفته در صفحات وب خود، به نحوی در ایجاد نوعی وب معنایی مشارکت کرده اند. با انتخاب برچسب ها، به عنوان نمونه برچسب های پیشنهادی Alta Vista یا Dublin Core (http://www.purl.org/dc/) شیوه هایی جهت توصیف پدید آورنده، عنوان وموضوع یک سند فراهم می شود. انتخاب کلیدواژه موضوعی احتمالاً مشکل تر است. اگر در یک شرکت کشاورزی کار می کنید ممکن است به عنوان مثال از AGRIS یا CAB Thesaurus یا سیاهه کلید واژگان خاص خودتان استفاده کنید.

ممکن در حال استفاده از یک بانک اطلاعاتی برای ایجاد وب سایت خود باشید. دراین صورت احتمالاً با ایکس.ام.ال به عنوان شیوه ای جهت ارسال داده ها به دیگران و دریافت داده ها از دیگر منابع به منظور درونداد دسته ای داده ها آشنا باشید. وقتی این موارد پیچیده تر می شوند، ممکن است از نرم افرارهای کاربردی ای استفاده کنید که معرّف لایه های منطق و برهان در وب معنایی هستند. به عنوان مثال ممکن است تنها پذیرای دروندادی باشید که با معیارهای خاصی مطابقت داشته باشد، به یک موضوع خاص مربوط باشد و به دوره زمانی خاصی محدود شود.

بسیاری از وب سایت های موجود دارای حوزه های امن متکی بر رمز عبور هستند اما مشکل توسعه وب سایت ها، به ایجاد اطمینان هنگام همکاری با سایر فراهم کنندگان اطلاعات جهت ایجاد خدمات مشترک و یا همکاری با کاربران جهت ارائه خدمات برمی گردد.

روشن است مادامی که وب معنایی تا قبل از رسیدن به دیدگاه های مطرح شده توسط افرادی چون تیم برنرزلی همچنان به تکامل خود ادامه می دهد، ما بایستی وب سایت های خود را جزئی از یک کل در نظر بگیریم و نه درانزوا از دیگر سایت ها. با توجه به این ایده، ارزش آن را دارد که توجه خود را معطوف شیوه ایجاد وب سایت ها کرده و با بهره گیری از فناوری های نوین به همکاری با دیگران جهت تدارک خدمات روی آوریم.
نویسنده (گان) : کریس ادیسون  
ترجمه از :حمید رضا جمالی مهموئی (دانشجوی دکترای اطلاع رسانی دانشگاه سیتی لندن)

مدیریت پیچیدگی

ایجاد و ابداع فنون و تکنیک‌های لازم برای مدیریّت پیچیدگی را باید به عنوان هستۀ بنیادین تلاش‌های علمی و پژوهشی گذشته، حال، و آینده، در تمامی زمینه‌های علوم رایانه، و به ویژه، در هوش مصنوعی معرّفی کرد. شیوه‌ها و تکنیک‌های هوش مصنوعی، در واقع، برای حلّ آن دسته از مسائل به وجود آمده است که به طور سهل و آسان توسط برنامه‌نویسی تابعی (Functional programming)، یا شیوه‌های ریاضی قابل حلّ نبوده‌اند.

در بسیاری از موارد، با پوشانیدن و پنهان ساختن جزئیّات فاقد اهمّیّت است که بر پیچیدگی فائق می‌آییم، و می‌توانیم بر روی بخش‌هایی از مسئله متمرکز شویم که مهم‌تر است. تلاش اصلی، در واقع، ایجاد و دستیابی به لایه‌ها و ترازهای بالاتر و بالاتر تجرید را نشانه می‌رود، تا آنجا که، سر‌انجام برنامه‌های کامپوتری درست در همان سطحی کار خواهند کرد که خود انسان‌ها به کار مشغولند.

به یاری پژوهش‌های گسترده دانشمندان علوم مرتبط، هوش مصنوعی از آغاز پیدایش تاکنون راه بسیاری پیموده‌است. در این راستا، تحقیقاتی که بر روی توانایی آموختن زبانها انجام گرفت و همچنین درک عمیق از احساسات، دانشمندان را در پیشبرد این علم، یاری کرده‌است. یکی از اهداف متخصصین، تولید ماشینهایی است که دارای احساسات بوده و دست کم نسبت به وجود خود و احساسات خود آگاه باشند. این ماشین باید توانایی تعمیم تجربیات قدیمی خود در شرایط مشابه جدید را داشته و به این ترتیب اقدام به گسترش دامنه دانش و تجربیاتش کند.

برای نمونه به رباتی هوشمند بیاندیشید که بتواند اعضای بدن خود را به حرکت درآورد، او نسبت به این حرکت خود آگاه بوده و با سعی و خطا، دامنه حرکت خود را گسترش می‌دهد، و با هر حرکت موفقیت آمیز یا اشتباه، دامنه تجربیات خود را وسعت بخشیده و سر انجام راه رفته و یا حتی می‌دود و یا به روشی برای جابجا شدن، دست می‌یابد، که سازندگانش، برای او، متصور نبوده‌اند.

هر چند مثال ما در تولید ماشینهای هوشمند، کمی آرمانی است، ولی به هیچ عنوان دور از دسترس نیست. دانشمندان، عموماً برای تولید چنین ماشینهایی، از تنها مدلی که در طبیعت وجود دارد، یعنی توانایی یادگیری در موجودات زنده بخصوص انسان، بهره می‌برند.

آنها بدنبال ساخت ماشینی مقلد هستند، که بتواند با شبیه‌سازی رفتارهای میلیونها یاخته مغز انسان، همچون یک موجود متفکر به اندیشیدن بپردازد.

مباحث هوش مصنوعی پیش از بوجود آمدن علوم الکترونیک، توسط فلاسفه و ریاضی دانانی نظیر بول (Boole) که اقدام به ارائه قوانین و نظریه‌هایی در باب منطق نمودند، مطرح شده بود. در سال ۱۹۴۳، با اختراع رایانه‌های الکترونیکی، هوش مصنوعی، دانشمندان را به چالشی بزرگ فراخواند. بنظر می‌رسید، فناوری در نهایت قادر به شبیه سازی رفتارهای هوشمندانه خواهد بود.

با وجود مخالفت گروهی از متفکرین با هوش مصنوعی که با دیده تردید به کارآمدی آن می‌نگریستند تنها پس از چهار دهه، شاهد تولد ماشینهای شطرنج باز و دیگر سامانه‌های هوشمند در صنایع گوناگون هستیم.

هوش مصنوعی که همواره هدف نهایی دانش رایانه بوده‌است، اکنون در خدمت توسعه علوم رایانه نیز است. زبانهای برنامه نویسی پیشرفته، که توسعه ابزارهای هوشمند را ممکن می‌سازند، پایگاههای داده‌ای پیشرفته، موتورهای جستجو، و بسیاری نرم‌افزارها و ماشینها از نتایج پژوهش‌های هوش مصنوعی بهره می‌برند.

در سال ۱۹۵۰ آلن تورینگ (َAlain Turing)، ریاضی دان انگلیسی، معیار سنجش رفتار یک ماشین هوشمند را چنین بیان داشت: «سزاوارترین معیار برای هوشمند شمردن یک ماشین، اینست که آن ماشین بتواند انسانی را(و حتی یک محقق) توسط یک پایانه (تله تایپ) به گونه‌ای بفریبد که آن فرد (و حتی یک محقق) متقاعد گردد با یک انسان روبروست.»

در این آزمایش شخصی از طریق ۲ عدد پایانه (رایانه یا تله تایپ) که امکان برقراری ارتباط و گپ‌زنی را برای وی فراهم می‌کنند با یک انسان و یک ماشین هوشمند، بطور هم‌زمان به پرسش و پاسخ می‌پردازد. در صورتی که وی نتواند ماشین را از انسان تشخیص دهد، آن ماشین، هوشمند است. خلاصه ابنکه مورد تحقیق قرار گیرد و محقق نتواند دریابد در آن طرف انسان قرار دارد یا کامپیوتر.

آزمایش تورینگ از قرار دادن انسان و ماشینید، از تفکری انسانی برخوردار است.

آزمایش تورینگ مدل سازی نحوه تفکر انسان، تنها راه تولید ماشینهای هوشمند نیست. هم اکنون دو هدف برای تولید ماشینهای هوشمند، متصور است، که تنها یکی از آن دو از الگوی انسانی جهت فکر کردن بهره می‌برد:

  • سیستمی که مانند انسان فکر کند. این سیستم با مدل کردن مغز انسان و نحوه اندیشیدن انسان تولید خواهد شد و لذا از آزمون تورینگ سر بلند بیرون می‌آید. از این سیستم ممکن است اعمال انسانی سر بزند.
  • سیستمی که عاقلانه فکر کند. سامانه‌ای عاقل است که بتواند کارها را درست انجام دهد. در تولید این سیستم‌ها نحوه اندیشیدن انسان مد نظر نیست. این سیستم‌ها متکی به قوانین و منطقی هستند که پایه تفکر آنها را تشکیل داده و آنها را قادر به استنتاج و تصمیم گیری می‌نماید. آنها با وجودی که مانند انسان نمی‌اندیشند، تصمیماتی عاقلانه گرفته و اشتباه نمی‌کنند. این ماشینها لزوما درکی از احساسات ندارند. هم اکنون از این سیستم‌ها در تولید عامل‌ها در نرم افزارهای رایانه‌ای، بهره گیری می‌شود. عامل تنها مشاهده کرده و سپس عمل می‌کند.

Agent قادر به شناسایی الگوها، و تصمیم گیری بر اساس قوانین فکر کردن خود است. قوانین و چگونگی فکر کردن هر Agent در راستای دستیابی به هدفش، تعریف می‌شود. این سیستم‌ها بر اساس قوانین خاص خود فکر کرده و کار خودرا به درستی انجام می‌دهند. پس عاقلانه رفتار می‌کنند، هر چند الزاما مانند انسان فکر نمی‌کنند.

با وجودی که برآورده سازی نیازهای صنایع نظامی، مهم‌ترین عامل توسعه و رشد هوش مصنوعی بوده‌است، هم اکنون از فراورده‌های این شاخه از علوم در صنایع پزشکی، رباتیک، پیش بینی وضع هوا، نقشه‌برداری و شناسایی عوارض، تشخیص صدا، تشخیص گفتار و دست خط و بازی‌ها و نرم افزارهای رایانه‌ای استفاده می‌شود