فال

قالب وبلاگ

قالب وبلاگ

اس ام اس عاشقانه

موتورهای جستجوی تصاویر - نمایه


نمایه
 
پيوند ها

محل درج آگهی و تبلیغات
 
نوشته شده در تاريخ سه‌شنبه ٢٧ اردیبهشت ۱۳٩٠ توسط نمایه

موتورهای جستجوی تصاویر

جمشید صادقیانی[1] و علی شعبانی[2]

چکیده

تا همین اواخر مجموعه های تصاویر دیجیتالی به علت محدودیت هایی که در تجهیزات و وسایل چاپ و پخش داشتند زیاد مورد استفاده قرار نمی گرفتند. اما با ورود فناوری های جدید کاربران به کمک آنها توانستند به طور مؤثری تصاویر را ذخیره و بازیابی کنند. یافتن موتورهای جستجوی مطلوب و اینکه چگونه از آنها استفاده شود می توان زمان بر باشد.  آشنایی با چنین ابزارهای جستجو کاربران را در دسترسی به اطلاعات در سرتاسر دنیا در روشی کارا و واضح توانمند می سازد. در ابن مقاله سعی شده است که به نمایه سازی تصویر و انواع روش های نمایه سازی تصویر و نظام های تشخیص چهره توجه شود و در پایان موتورهای جستجوی تصویر معرفی گردد.

کلید واژه : موتور جستجوی تصویر ، نمایه سازی، نمایه سازی تصویر

 

 

مقدمه

تا همین اواخر مجموعه تصاویر دیجیتالی به علت محدودیت هایی که در تجهیزات و وسایل چاپ و پخش داشتند زیاد مورد استفاده قرار نمی گرفتند . اما با ورود فناوری های نوین کاربران به کمک آنها توانستند به طور مؤثری تصاویر را ذخیره و بازیابی کنند. پایگاه های اطلاعاتی تصاویر دیجیتالی و فناوری های پردازش تصویر در طی چند سال گذشته به طور چشمگیری توسعه یافته است. پایگاه های اطلاعاتی تصاویر درحال فراهم آوردن دسترسی مؤثر به مجموعه تصاویر هستند. به منظور دسترسی و استفاده از تصاویر، کاربران نیازمند ابزارهای مطمئنی هستند و به علت حجم زیاد اطلاعات جستجوی تصاویر در وب شبیه گشتن به دنبال یک سوزن در انباری از کاه است. ابزاری که می تواند کاربران را کمک کند تا تصاویر مورد نظر خود را بازیابی و جایابی کنند، همانا موتورجستجوی تصویر است (حسن و زنگ،2001). کاربران اینترنتی با تجربه، پرسش خود را با موتورهای جستجوی تخصصی به منظور به دست آوردن نتایج مطلوب شروع می کنند، و زمانی از موتورهای جستجوی عمومی برای پرسش خود استفاده می کنند که موتورهای جستجوی تخصصی نتوانند اطلاعات مفید راجع به پرسش مورد نظرشان بدهد (بیجی و دیگران ، 1998).

 

انواع موتور های جستجو در اینترنت

موتورجستجو یا جستجوگر به طور عمومی به برنامه ای گفته می شود که کلمات کلیدی را در یک سند یا پایگاه اطلاعاتی جستجو می کند . در اینترنت به برنامه ای گفته می شود که کلمات کلیدی موجود در فایل ها و سندهای وب جهانی، گروه های خبری، منوهای گوفر وآرشیوهای FTP را جستجو می کند.

موتور های جستجو به دو دسته کلی زیر تقسیم می شوند:

1.      موتور های جستجوی خودکار: این موتور های جستجو مانند گوگل، فهرست خود را به صورت خودکار تشکیل می دهند. آنها وب را پیمایش کرده، اطلاعاتی را ذخیره می کنند. سپس کاربران از میان این اطلاعات ذخیره شده، آنچه را که می خواهند جستجو می کنند. اگر شما در صفحه وب خود تغییراتی را اعمال کنید موتورهای جستجو خودکار، آنها را به طور خودکار می یابند و سپس این تغییرات در فهرست اعمال خواهد شد. عنوان، متن و دیگر عناصر صفحه همگی در این فهرست قرار خواهند گرفت.

2.      راهنمای های دستی (غیر خودکار): یک راهنمای دستی مانند یک فهرست باز[3]Dmoz وابسته به کاربرانی است که آن را تکمیل می کنند. شما صفحه مورد نظر را به همراه توصیفی مختصر در فهرست ثبت می کنید، یا، این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده انجام می شود . عمل جستجو در این حالت تنها بر روی توضیحات ثبت شده صورت می گیرد و در صورت تغییر روی صفحه وب، روی فهرست، تغییر به وجود نخواهد آورد . آنچه برای بهبود نمایه سازی و رتبه بندی یک موتور جستجو مفید است، تأثیری بر بهبود رتبه بندی یک راهنمای وب ندارد. تنها استثنا این است که یک سایت خوب یا پایگاه داده های با محتوای خوب، شانس بیشتری نسبت به یک سایت یا پایگاه داده ضعیف دارد. البته در مورد کاوشگرهای مشهور مانند گوگل و یاهو یک مؤلفه دیگر هم برای بهبود رتبه بندی وجود دارد که کمک مالی است. یعنی وبگاه هایی که مایل به بهبود مکان وبگاه خود در رده بندی هستند می توانند با پرداخت پول به این کاوشگرها به هدف خویش برسند (ویکی پدیا، 2007)

نمایه سازی تصویر

به خاطر حجم زیاد منابع تصویری، استفاده کننده برای یافتن تصویر علاوه بر موتورهای جستجو، به یک نمایه جامع از تصاویر اینترنت نیاز دارد که بدون آن بازیابی تصویری خاص از اینترنت می تواند خیلی دشوار و زمان بر باشد.

ویژگی ها و خصوصیات منحصر به فرد تصاویر نسبت به سایر منابع اطلاعاتی، کار نمایه سازی تصاویر را با چالش های زیادی مواجه ساخته است . بسر[4]اشاره می کند که دو فاکتور به هم مرتبط، مجموعه تصاویر را از منابع متنی جدا می کند: 1) بسیاری از تصاویر در طبیعت ماهیت چند رشته ای دارند و احتمال دارد که توجه محققان رشته های مختلف را به خود جلب کنند. 2) تصاویر بر خلاف کتاب و دیگر اسناد، با عنوان و مقدمه یا چکیده توصبف نمی شوند؛ این باعث می شود فرد به برداشت شخصی خود از تصویر و محتوای موضوعی آن متکی باشد، که ممکن است شخص در مورد تصاویر سمبولیک وتمثیلی در طبیعت با مشکل مواجه شود. انتخاب نوع نظام نمایه سازی از دیگر مواردی است که می توان به آن اشاره کرد (باکستر، 1995 ). بنابراین، روشن است که نمایه سازی تصاویر فعالیتی آسان و ساده نیست. فراهم کردن نقاط دسترسی متعدد برای کاربرانی که قصد دارند تصاویر را بازیابی کنند مستلزم هزینه فراوان و فعالیتی مداوم است که بسر(1990) اشاره می کند "یک تصویر شاید بهتر از هزاران کلمه باشد، ولی این احتمال وجود دارد که هزاران توصیفگر برای نشان دادن محتوای یک تصویر، کفایت نکند" (باکستر، 1995). (1990)

 

روش های نمایه سازی تصاویر

ذخیره و بازیابی تصاویر از دهه1970 به بعد به نوعی مقوله پژوهشی فعال تبدیل شده و پژوهشگران دو حوزه مدیریت پایگاه اطلاعات و حوزه مهم رایانه دراین زمینه به فعالیت پرداخته اند (نعمت زاده،1382 ). هریک از این گروه با استفاده از برخی ویژگی ها ی تصاویر کوشیده اند تا دسترسی کاربران را به این منابع فراهم سازند. کتابداران و نمایه سازان که به عنوان مدیران پایگاه های اطلاعاتی به شمار می آیند بیشتر به ویژگی های متنی تصویر می پردازند، یعنی رویکردی مبتنی بر متن دارند (نعمت زاده،1382). روش دیگر به ویژگی های محتوای تصویر می پردازد، یعنی رویکردی مبتنی بر محتوا دارد.

 

بازیابی و نمایه سازی مبتنی بر متن

بازیابی و نمایه سازی مبتنی بر متن می تواند بر اساس فنون قدیمی بازیابی اطلاعات متنی باشد. با این حال برای بهبود انجام بازیابی، شخص باید با روش استفاده از ساختار اسناد HTML آشنایی داشته باشد، به خاطر اینکه کلمات و اصطلاحاتی که در موقعیت های مختلف از یک سند HTML حضور می یابند، سطوح مختلفی از اهمیت یا ربط را با تصاویر مرتبط دارند. بنابراین فرد باید کلمه مناسب بر اساس موقعیت های کلمه اختصاص دهد. ما نیز لازم است برچسب ها و اصطلاحات مناسبی که به طور مستقیم با تصاویر مرتبط هستند، اختصاص بدهیم .

 

شیوه بازیابی تصاویر در نظام های بازیابی تصویر مبتنی بر متن برروی وب

اطلاعات مورد نیاز برای یافتن تصاویر بر روی وب جهان گستر را به طور کلی از دو منبع می توان به دست آورد: متن مربوط به تصویر و خود تصویر. هنگام استفاده از اطلاعات این دو منبع، برنامه ای باید بتواند با موفقیت تصاویر درخواستی را بازیابی کند که آن برنامه موتورهای جستجوی تصاویر هستند. در نظام مبتنی بر متن اطلاعات مریوط به متن خود تصویر بر اساس موقعیت هایشان رده بندی می شوند که بر اساس گروه های زیر است:

1.      نام فایل تصویر[5]: نام های فایل شامل عبارات مهمی در رابطه با محتوای فایل هستند، در موارد زیادی، آدرس جاینمای جهانی[6]http://www2.int_every.fr/~hug/images/marilyn/mmtrans.gif ”) ) شامل اطلاعات بیشتری به نسبت یک URL وابسته است (e. g. “mm –trans .gif ” ) ، که ممکن است در منبعHTML قرار داده شده باشد.   یک تصویر

2.      عنوان تصویر[7] : اغلب تصاویر شامل عناوینی هستند که تصاویر را توصیف می کنند. اگر چه زبانHTML برچسب عنوانی واضحی برای تصاویر ندارد. اغلب عنوان ها به صورت متنی علامت گذاری می شوند که در درون برچسب مرکز ساز مشابهی از تصویر ، (http://www.lib.uchicago.edu/~mozart/Marlyn/monthy.htmlhttp://studentweb.tulane.edu/~llovejo/marilyn))، یا در داخل پاراگراف یکسانی (http://tomahawk.cf.ac.uk/~scotw/marilyn) ، جاگذاری می شوند.)، در داخل خانه یکسانی در یک جدول به عنوان یک تصویر

3.      برچسب < : <ALTفیلد تصویردر اسناد  HTML ممکن است شامل بخش <<ALT ویژه ای باشد تا به عنوان متن جایگزین[8] زمانی که تصویر نمی تواند بار شود، نشان داده می شود. این متن جایگزین ممکن است به طور مختصر محتوای تصویر را توصیف کند. برای مثال متن جایگزین برای پارگرافی از یک شخص که ممکن است شامل نمونه، نام شخص در پاراگراف باشد . متن جایگزین ممکن است همچنین اشاراتی به هدف مورد نظر تصویر داشته باشد. برای مثال تصویری که شامل تبلیغ کوکا کولا است، متن جایگزین ممکن است شامل متن جایگزین ((کوکا کولا بخرید)) باشد.

4.      برچسب  HTML: عنوان HTML سند ( در بالای صفحه نمایش، توسط مرورگر نشان داده می شود، که برای فهرست های تاریخی و غیره به کار برده می شود)، اغلب اطلاعاتی درباره محتوای تصاویری که در داخل سند قرار دارند فراهم می آورد.

5.      فرا پیوندها[9]: متن یک فرا پیوند معمولا˝ عبارات کلیدی را پیرامون آنچه یک پیوند به آن ارجاع می دهد، نشان می دهد. در بسیاری از موارد تصاویر، به جای این که در داخل متن صفحه جاسازی شوند به وسیله فرا پیوندها به آنها اشاره می شود (متن پیوندها به یک تصویر از سوی وبگاه ها توسط موتورهای جستجو به عنوان موضوع تصویر پیوند شده در نظر گرفته می شود).

6.      متون دیگر: علاوه بر موارد ذکر شده در بالا متون دیگر می تواند راهنمایی در مورد تصویر موجود در صفحه بدهد. این متن می تواند برای نمایه سازی تصاویر در صفحه، با احتمال کمتری نسبت به دیگر دسته های متنی که در بالا ذکر شدند، بکار برده شود.

 

 

اطلاعات مرتبط  دیگری که می توان به طور مستقیم از محتوای خود تصاویر کسب کرد، شامل موارد زیر است:

  • سیاه و سفید در برابر رنگی : گاهی ممکن است فقط تصاویر رنگی را بخواهید. در حالی که تصاویر رنگی می توانند به سیاه و سفید برگردانده شوند، آنهایی که تصاویر سیاه و سفید را جستجو می کنند، چیزهای واقعی را می خواهند.
  • اندازه تصویر[10] : معمولا˝ برای افرادی که می خواهند تصاویر را به روی پرده به اندازه مشخصی کوچک تر نشان بدهند، مفید است.
  • نوع فایل[11] (JPEG,GIF
  • اندازه فایل[12]؛
  • تاریخ فایل[13] :  اگر کسی در جستجوی تصاویر جدیدتر باشد، تاریخ می تواند برای نشان دادن تصاویری که حتما˝ از زمان مشخصی قدیمی تر هستند استفاده شود.

به دست آوردن اطلاعات فراتر از آنچه که در بالا ذکر شد، نیاز به تحلیل تصویر دارد. روش های مفیدی که برای تحلیل تصویر به کار برده می شود به سه دسته زیر تقسیم می شوند:

1.      رده بندی تصویر به یک یا چند نوع (مانند عکس، طراحی دستی، طراحی کامپیوتری).

2.      تشخیص ساختار تصویر(مانند صورت، لبه ها).

3.      مایز قائل شدن بین نواحی خاص به طور اولیه به وسیله ویژگی های رنگ/ متن (مانند: پوست، آسمان، برگ درختان)(فرکل و دیگران، 1996) .

 

بازیابی و نمایه سازی تصاویر مبتنی بر محتوا

در این نظام به جای نمایه سازی دستی تصاویر، آنها را با استفاده از محتوای بصری نمایه سازی می کنند. ذخیره و بازیابی تصاویر از طریق استخراج خودکار ویژگی ها و مشخصات اصلی تصویر مانند رنگ ، شکل و موقعیت مکانی صورت می گیرد ( نعمت زاده، 1382) و پژوهش های زیادی به منظور توسعه دادن به نظام هایی که به جای تکیه بر توصیف تصویر از طریق متن از تحلیل محتوا، به منظور تطبیق دادن تصویر با توجه به سؤال کاربر استفاده می کنند، صورت گرفته است. بیشتر مبتنی بر تحلیل ریاضی و آرایه پیکسل هایی است که یک تصویر دیجیتالی را تشکیل می دهد (باکستر، 1995).

ویژگی های تصویری که با روش مبتنی بر محتوا تحلیل می شوند به سه سطح زیر قابل تقسیم هستند:

1.      ویژگی های اصلی و اولیه تصویر مانند: رنگ،شکل؛

2.      ویژگی های منطق نظیر موجودیت اشیاء نمایش داده شده در تصویر؛

3.      ویژگی های خاص تصویر مانند مفهوم و معنای تصویر(عباس پور،1384)

استفاده از ویژگی رنگ یکی از کارآمدترین روش های ذخیره و بازیابی تصاویر در نظام های مبتنی بر محتواست. بخش اعظم این روش مبتنی بر تحلیل ریاضی آرایش پیکسل هایی که یک تصویر را تشکیل می دهد، قرار دارد. متداول ترین روش در بازیابی بر اساس رنگ تصاویر استفاده از هیستوگرام های رنگ است که بسیار مورد توجه قرار گرفته است. فوایدی همچون پایداری، مؤثر بودن، سادگی پیاده سازی، سادگی محاسباتی و حجم پایین ذخیره سازی نمایه های استفاده از هیستوگرام رنگ را توجبه پذیرکرده است.از جمله روش هایی که برای نمایه سازی و بازیابی تصاویر براساس رنگ در نظام های ماشینی کاربرد دارد، رده بندی سلسله مراتبی[14] و سنجش مشابهت تصاویر[15] است. در روش نخست با استفاده از توصیفگرهای رنگ در طرح رده بندی رنگ، اهمیت هر یک از رنگ ها تعیین می شود. اهمیت هر رنگ وابسته به مسافتی از تصویر است که آن رنگ به خود اختصاص داده است . به عبارت دیگر، رنگی که بیشترین مقدار را تشکیل می دهد به عنوان طرح رنگ اصلی در نظر گرفته می شود و شماره گروه آن رنگ با نخستین رقم از شماره های سلسله مراتبی نشان داده می شود. اما روش دوم الگویی برای نشان دادن توزیع فضای رنگ در یک تصویر ارائه می دهد. این الگو شباهت میان تصاویر را بررسی می کند. معمولا ًبرای این کار، تصویر را با استفاده از اسکنر وارد سیستم کرده و هیستوگرام های مربوط را ترسیم می کنند. برای مقایسه هیستوگرام های تصاویر از معیاری به نام فاصله اقلیدسی استفاده می شود . برای هر تصویر بردارهایی با عنوان بردارهای ویژگی رنگ تهیه می شود. با مقایسه بردارهای هر تصویر با دیگری و با کمک معیار فاصله اقلیدسی می توان تصاویر را از یکدیگر متمایز ساخت. ولی علی رغم فواید و ویژگی های استفاده از هیستوگرام رنگ، زمانی که حجم پایگاه تصاویر افزایش می یابد محدودیت های آن به چشم می خورند. برای مثال، تصاویر متفاوت ممکن است هیستوگرام های مشابه و یکسان داشته باشند، علاوه بر آن تصاویر تحت شرایط نوری متفاوت می توانند هیستوگرام های رنگ ناهمگون داشته باشند (عباس پور، 1384).

در بازیابی تصاویر مبتنی بر محتوا[16] سؤال کاربر به دو شیوه تقسیم می شود:

1.      به صورت یک تصویر، مشابه با آنچه که مورد نیاز است و از قبل با هدف تطبیق کردن، در سیستم وجود دارد بازیابی می شود.

2.      به صورت یک سؤال ، ساختار مورد دلخواه خواسته شده را شرح می دهد (باکستر، 1995).

از میان نظام های بازیابی تصاویر مبتنی بر محتوا برروی وب می توان به نظام هایWebSeek و Visual Seek اشاره کرد که به منظور استفاده در وب جهان گستر طراحی شده، و به کاربر اجازه می دهند که برای ورود به این نظام ها پرسش های خود را از طریق کلید واژه ها و ویژگی های بصری ارائه دهند. این دو سیستم در دانشگاه کلمبیا توسعه یافته اند (کرمی، 1385). نظام نمایه سازی دیگر Excalbur Retrival Ware است که به کاربران اجازه می دهد تا در جستجوی تصاویر، بر رنگ، شکل ظاهری و وضوح و وزن نسبی متکی باشند (کرمی، 1385).Photobook   و Informedia از دیگر نظام ها در محیط وب هستند که بر اساس بازیابی تصاویر مبتنی بر محتوا عمل می کنند (گودرام، 2001) . یکی از موفق ترین نظام های مبتنی برمحتوا، QBIC[17] است که توسط شرکت IBM توسعه یافته است که به کاربران اجازه می دهد تا تصاویر مرتبط را به وسیله کشیدن آنچه که در ذهن دارند جستجو کنند، ویا از طریق گزینش تصویر مرتبط از روی الگوهای متنی و رنگی آن را بازیابی کنند.QBIC یک نظام نیمه خودکار است که از رنگ و متن برای نمایه سازی و بازیابی تصاویر استفاده می کند (ال قواسم،2003) .

 

شکل1: بازیابی تصاویر در نظام های مبتنی بر محتوا

 

نظام های تشخیص چهره

اگر چه مفهوم تشخیص هر کس از طریق ویژگی های چهره امری ذاتی است، تشخیص چهره به عنوان روشی بیومتریک، تشخیص انسانی را بیشتر به صورت فرایند رایانه ای و خودکار می نماید. آن چه تشخیص چهره را از دیگر روش های بیومتریک جدا کرده است کاربرد آن برای اهداف نظارتی است، برای مثال اولیای امور مربوط به امنبت عمومی، برای مشخص کردن محل افراد خاص همانند مجرمان تحت تعقیب، تروریست های  مظنون، بچه های گم شده، از آن، برای انجام این مأموریت ها کمک می گیرند. تشخیص چهره به عنوان یک روش بیومتریک، شکلی از تصویررایانه ای است که از چهره ها جهت تشخیص یک شخص یا تأیید هویت خواسته شده آن فرد به کار می رود. صرف نظر از روش های خاص مورد استفاده، تشخیص چهره در پنج مرحله زیر انجام می شود.

1.      فراهم آوردن تصویری از چهره. این فراهم آوری می تواند با اسکن کردن دیجیتالی عکس موجود یا با استفاده از دوربین الکترو-اوپتیکال برای فراهم آوری تصویر زنده از از یک موضوع،  انجام شود.

2.      به کار بردن نرم افزاری برای نشان دادن مکان هر چهره در تصاویر فراهم آورده شده. که کاری مشکل است، و اغلب الگوها را به آن چه که "شبیه به نظرمی آید" تعمیم می دهد.

3.      زمانی که نرم افزار تشخیص چهره، چهره ای را می خواهد شناسایی کند، آن را مورد تجزیه و تحلیل قرار می دهد. نرم افزار تشخیص چهره هندسه فضایی ویژگی های مجزای چهره را تجزیه و تحلیل می کند. فروشندگان مختلف از روش های گوناگون برای بیرون کشیدن ویژگی های هویتی چهره استفاده می کنند. بنابراین جزئیات خاص به کار گرفته شده در روش ها، اختصاصی و محرمانه است.

4.      چهارمین مرحله، مقایسه الگو های ایجاد شده در مرحله سه با تصاویر ذخیره شده در پایگاه اطلاعاتی است. در زمان استفاده جهت شناسایی چهره این فرایند، نمراتی را به دست می دهد که نشان می دهد که چقدر الگوهای ایجاد شده با تصاویر ذخیره شده در پایگاه اطلاعاتی مرتبط هستند.

5.       آخرین مرحله تعیین این امر است که تمام نمره های حاصل شده در مرحله چهار آن قدر بالا می باشند که تصویر یافته شده با آن تطبیق شود. اعلام تطبیق واقعی تصویر معمولاً با نظر کاربر نهایی است (ود ورد و دیگران، 2003).

 

دو مشکل موجود در نظام های تشخیص چهره

   علی رغم موفقیت در بسیاری از نظام های مبتنی بر آزمونFERET  ، مسائل بسیاری هنوز وجود دارند که باید مورد توجه قرار گیرند. در این بین می توان به دو تای آن ها که در بیشتر نظام ها وجود دارند، اشاره کرد ،1) مسئله وضوح[18]  2) مسئله حالت. مسئله مربوط به وضوح تصویر در شکل .2 نشان داده می شود. جایی که چهره یکسانی به خاطر تغییر در میزان روشنایی در حالت های مختلفی ظاهر می شود. به طور اخص، تغییرات ناشی از تغییر در وضوح تصویر می تواند به نسبت  تفاوت های بین افراد بزرگ تر شوند. مسئله مربوط به حالت نیز در شکل3 نشان داده می شود. جایی که چهره یکسانی به خاطر تغییر در زاویه دید، به طور مختلفی ظاهر می شود. علاوه بر این، زمان تغییر وضوح تصویر، عمل تشخیص چهره مشکل تر می شود. تصویر

     

شکل 2: مسئله وضوح تصویر

 

شکل 3: مسئله حالت( و وضوح تصویر)

 

حل مسئله وضوح تصویر

به عنوان مسئله اصلی در حوزه فهم تصویر، مسئله وضوح تصویر عموماً مشکل است و توجهات زیادی را به خود جلب کرده است. برای تشخیص چهره، رویکردهای بسیار خوبی ارائه شده اند که به چهار دسته تقسیم می شوند:

1.      رویکردهای ذهنی، که با کنار گذاشتن بخش های اصلی مهم، اختلاف های ایجاد شده به خاطر وضوح می توانند کاسته شوند. که به طور تجربی نیز تأیید شده است؛

2.      رویکردهای مقایسه تصویر، که از بازنمون های مختلف تصویر و مقیاس های فاصله ای استفاده می شود. بازنمون های تصاویر مورد استفاده عبارتند از: طرح های لبه، مشتقات به دست آمده از سطح خاکستری، تصاویر فیلتر شده با توابع همانند دو بعدی گوبر[19]. مقیاس های مختلف فاصله ای به کار برده شده عبارتند از: فاصله نقطه هوش[20]مدار، که در این روش از الگوهای سه بعدی برای برطرف کردن مسئله مربوط به وضوح تصویر استفاده می شود. ، فاصله ناحیه ای؛

3.      رویکردهای مبتنی بر گروه، این روش گستره ای است از زیر فضا های خطی سه بعدی، بنابراین به سه تصویر مرتب، دستکاری شده، که تحت روشنایی های مختلف فراهم آورده شده باشد، نیاز دارد؛

4.      رویکردهای الگو

 

حل مسئله حالت

پژوهشگران روش های مختلفی برای از بین بردن مشکل تغییرحالت ارائه داده اند. که به سه دسته تقسیم می شوند: 1) رویکرد های مبتنی بر تصاویر چندگانه، که ابتدا به وسیله بایمر[21]ارائه شد و در آن یک ارتباط مبتنی بر الگو، طرح ارائه شده را تطبیق می کند. در این کار، برآورد موقعیت و تشخیص چهره در یک انحنای تکراری، پیوند داده می شوند. در هر حالت فرضی تصویر ورودی به منظور تطبیق با تصاویر پایگاه اطلاعاتی برای یک حالت انتخاب شده مرتب می شوند. مرتب کردن ابتدا از طریق یک تغییر شکل دو بعدی مبتنی بر سه ویژگی کلیدی نقاط (بینی و چشم ها) ، و سپس جریان بصری مورد استفاده برای خالص کردن ردیف هر نمونه است . بعد از این مرحله نمرات وابسته به همه زوج های الگو های تطبیقی برای انجام دادن عمل تشخیص مورد استفاده قرار می گیرند. 2) رویکردهای چندگانه، الگوریتم های زیادی برای این نوع ارائه شده اند، که بیشتر از رویکرد های مبتنی بر تصاویر چندگانه مورد استفاده قرار می گیرند. شاید به این دلیل باشد که احتمال موفقیت آن بیشتر است، و تنها روش کاربردی است که تا به حال ارائه شده است (جآو و چلپا، 2002).

 

تحقق پایگاه های اطلاعاتی تصاویر

تحقق پایگاه های اطلاعاتی تصاویر مفید، به چهار عاملی که بر ساختار پایگاه های اطلاعاتی تأثیر می گذارند، بستگی دارد:

1.      جنبه فیزیکی پایگاه:  به اندازه فیزیکی پایگاه و ساختار ذخیره تصویر مربوط می شود. که شامل تعداد تصاویر و برخی فاکتورهای دیگر (به عنوان مثال کیفیت و تفکیک پذیری)، تجهیزات و امکاناتی که بوسیله آن تصاویر اسکن می شوند ونیز نوع فرمت فایل تصویر می شود.

2.      جنبه سازمانی پایگاه: به ارتباط بین پایگاه اطلاعاتی تصویر و فردی که مسئول محتوا و امکانات آن است بر می گردد.

3.      جنبه کاربردی پایگاه: کاربران بالقوه پایگاه و نیازهایشان را در بر می گیرد.

4.      جنبه فکری پایگاه: مسائل مربوط به دسترسی منطقی به پایگاه اطلاعاتی تصاویر و موضوعات مربوط به حق مؤلف را در بر می گیرد (حسن وزنگ، 2001) .

 

کاربردهای بازیابی تصاویر

از زمان پیدایش وب جهان گستر از لحاظ تعداد و دامنه صفحات ، رشد زیادی داشته است،  به طوری که امروزه تعداد آن چندین میلیارد برآورد می شود. ایکنز[22]طی یک بررسی مسائل بازبابی تصاویر را چنین برمی شمارند : و گراهام[23]

1.      حقوق معنوی

یکی از کاربردهای بازیابی تصاویر می تواند برای حمایت از حق صاحب امتیاز تصویر باشد. به علت گسترش سریع تصاویر حقوق مالک در وب، حیاتی است. یکی از روش های موجود استفاده از نشانه گذاری دیجیتالی[24] است. که با اضافه کردن برچسب یا توصیف گر برروی تصویر، مانع از استفاده غیر قانونی آن می شوند .اگر چه این روش برای پردازش تصویر و شکست هندسی تصویر مضر است، استفاده از این روش زمان شناسایی تصاویر را بالا می برد.

2.      فیلتر کردن مواد بالغین

امروزه تصاویر غیر اخلاقی فراوانی در وب وجود دارد که دسترسی به این نوع تصاویر برای کودکان و حتی بالغین در برخی فرهنگ ها، دغدغه اصلی افراد است. در سال های اخیر پژوهشگران، به استفاده از تکنیک های تصویر مجازی در رایانه، رو آورده اند که به طورخودکار تصاویر مربوط به مسائل جنسی را تشخیص می دهد.  این روش از یک الگوریتم ویژه ای برای تشخیص افراد برهنه در تصویر استفاده می کند.

3.      اجرای قانون

بازیابی تصاویر بر اساس محتوا کاربردهای گوناگونی در اجرای قانون و جلوگیری از وقوع جرایم دارد، مثل تشخیص اثر انگشت، تشخیص چهره، تطبیق دی ان ای و شناسایی رد پا  و نظام های نظارتی بسیاری از افراد از اینترنت برای فروش و به نمایش گذاشتن کالاهای غیر قانونی خود مثل مواد مخدر، قاچاق اسلحه و... استفاده می کنند. چون این گونه وبگاه ها دارای اطلاعات دیداری زیادتری نسبت به اطلاعات متنی هستند، تکیه بر روش های بازیابی متنی در این مورد نمی تواند کافی باشد . استفاده از نظام های مبتنی بر متن و همچنین نظام های مبتنی بر محتوا می تواند کمک شایانی به شناسایی این گونه وبگاه ها نمایند.

4.      مسافرت و گردشگری

مردم قبل از مسافرت به مکانی خاص، خواهان آن هستند که  اطلاعات بیشتری راجع به آن مکان به دست آورند. اطلاعات ممکن است شامل دیدن نقشه یک کشور یا شهر باشد که اطلاعات گردشگری راجع به آن محل را ارائه می دهد. هیچ شیوه ای بهتر از استفاده از اینترنت، که دارای تصاویر زیادی از کشور های جهان است وجود ندارد. اما ابزاری برای بازیابی تصاویر در اینترنت لازم است. به علاوه فهرست تصاویر موجود در اینترنت می تواند مسافران را در یافتن اطلاعات موردنظر کمک کند (ایکنس وگراهام، 1999).

5.      آموزش

آموزش یکی از کاربردهای مهم تصاویر در اینترنت است. اکثر دانشجویان برای انجام پژوهش به دو دلیل نیازمند تصاویر هستند: 1. به عنوان منبع اطلاعاتی ( به عنوان نمونه تعیین قلمرو ایران در دوران قاجاریه) 2. برای تشریح نظرات خویش با استفاده از تصویر. بسیاری از این گونه تصاویر در اینترنت وجود دارد و دانشجویان می توانند آنها را جستجو و بازیابی کنند. البته مسئٔله اصلی نحوه نمایه سازی و بازیابی تصاویر از طریق اینترنت است و استفاده از موتورهای جستجو این مشکل را تا حدودی بر طرف کرده است (ایکنس وگراهام، 1999).

 

معیارهای ارزیابی موتورهای جستجوی تصاویر

اما به طور کلی به علت نبود استانداردهایی برای ارزیابی موتورهای جستجو ، معیار های زیر است در نظر گرفته می شوند:

 

 

جدول(1). معیارهای ارزیابی موتورهای جستجو(تیسی، 2007)

دامنه پوشش

اندازه دامنه: نمایه تا چه مقدار وسیع و جامع است؟ آیا آن به روشنی بیان شده است؟

به روز بودن: هرچند وقت یکبار نمایه روزآمد می شود؟ آیا به روشنی بیان شده است؟

جستجو

ساده / پیشرفته: آیا گزینه های جستجو ساده و پیشرفته در موتور وجود دارد؟

پیشرفته: آیا امکان استفاده از عملگرهای بولی وجود داردَ؟

گزینه ها

فیلترینگ: آیا امکان محدود کردن جستجو قبل و بعد از آن وجود دارد؟

مواد بالغین: آیا آنها در موتور جستجو حذف شده اند؟

عملکرد

سرعت: آیا نتایج سریع بازیابی می شوند؟

آیا تعداد نتایج از لحاظ اندازه و دامنه نمایه معقول است؟

آیا امکان رؤیت تمام نتایج میسر است؟

ربط: نتایج بازیابی شده تا چه حد با نیاز جستجوگر مرتبط است؟

کیفیت: کیفیت ارائه تصاویر در چه حد است؟

جریان: آیا تصاویر محو شده یا پیوندهای کور[25] وجود دارد؟

حق مؤلف

آیا بیانیه ای در مورد قانون حق مؤلف وجود دارد؟

نمایش

تصاویر کوچک: آیا نتایج به صورت تصاویر کوچک یا تنها به صورت پیوند ارائه می شوند؟

اطلاعات فایل: آیا تصاویر مواردی از قبیل قالب، اندازه فایل، بعد تصویر یا اطلاعات مربوط به رنگ را در بر می گیرد؟

 

منابع

صفی نیا، سینا. (1381) ." توانایی ها و قابلیت های مخصوص گوگل : جستجوی تصاویر ، بررسی ساختار و تکنیک جستجو" .دانش و کامپیوتر، سال سوم ، شماره 22.ص 19

عباس پور ، جواد. (1384)." نمایه سازی تصاویر ، چالش و رویکردها".کتابداری ،سال نهم ، دفتر چهل و چهارم .ص 167-177

کرمی ،افسانه. (1385) . نمایه سازی تصویر در پایگاههای اطلاعاتی                                .                       http://www.irandoc.ac.ir/data/e_j/vol6 available at :

نعمت زاده ، نسیم ؛ صفا بخش ، رضا. (1382). بازیابی مبتنی بر رنگ تصاویر بر اساس محتوا .

available at : http.//www. Pardise.net/articles                  

    Baxter, Graeme; Anderson, Douglas(1995)."Image indexing and retrieval: some problems and propsed solutions".New library World, 96(1123), pp.4-13. [on-line]. available at:

 http ://   www.emeraldisinight.com                                          

   Beigi, Mandis; B.Benitez, Ana; Fu Chang, Shih(1998)."MetaSEEk: A Content-Based Meta- Search Engine for Images". Department of Electrical Engineering & New Media Technology Center Columbia University , New York , NY 10027

Eakins J.P; Grahmm. E(1999)"Content Based Image Retrival". A Report to the JISC Technology Application Program .University Of Northumbbia AtNewcastle,U.K

      El – Qawasmeh, Eyas(2003).”A quadtree –based representation technique for indexingand retrieval of image databases”.J. Vis. Commun. Image R. 14. pp. 340-357[on-line].available at:

http://www.ComputerScienceWeb.com     

     Frankel , Charles ; J .Swain , Michael ;Athitisos , Vassilis(1996). "WebSeer :AnImage Engine for the World Wide Web ". The Univesity of Chicago Computer Science Department .Technical Report 96-14.

     Goodrum , abby ; Spink , Amanda(2000)"Image searching on the Excite Web search engine" .Information Processing and Managemant. 37. pp. 295-311.[on-line]. available at :

http ://  www.elsevier.com/locate/information   

     Hassan , Ibrahim ; Zhang, Jin(2001)."Image search engine fauture analysis". Online Information Review.25(2). pp. 103-114.[on-line].available at:

 http://www.emerald-library-com/ft

    Woodward, J; Horn, Christopher; Julius, G ; Aryn, T(2003) "Biometrics: A look at Facial Recognition". Research reported conducted by RAND Public Safety and Justice for the Virginia State Crime Commission.

    Zhao Wen, Yi; Chellappa, Rama(2002)." Image- based Face Recognition: Issues and Methods".available at:

           http://www.cfar.umd.edu/_wyzhao/publication.html

 

 

[1] دانشجوی کارشناسی ارشد دانشگاه تهران

[2] دانشجوی کارشناسی ارشد دانشگاه تهران

[3]Open Dirctory

[4]Besser

[5]Image File Names

[6]URL

[7]Image Captions

[8]Alternat text

[9]Hyperlinks

[10]Image size

[11]File Tipe

[12]File Size

[13]File Date

[14]Hierarchical Pereptual Classification

[15]Peraptual Similarity Maching

[16]Content based image retrieval (CBIR)

[17]Query By Image Content (CBIR)

[18]illumination

[19]Gobr

[20]point- wise distance

[21]Beymer

[22]Eakins

[23]Grahmm

[24] Water mark

 


.: Weblog Themes By Pichak :.





تمامی حقوق این وبلاگ محفوظ است | طراحی : پیچک
فال حافظقالب وبلاگقالب وبلاگگالری عکسفاگالری عکس آلامتو