موتورهای جستجوی تصاویر

موتورهای جستجوی تصاویر

جمشید صادقیانی[1] و علی شعبانی[2]

چکیده

تا همین اواخر مجموعه های تصاویر دیجیتالی به علت محدودیت هایی که در تجهیزات و وسایل چاپ و پخش داشتند زیاد مورد استفاده قرار نمی گرفتند. اما با ورود فناوری های جدید کاربران به کمک آنها توانستند به طور مؤثری تصاویر را ذخیره و بازیابی کنند. یافتن موتورهای جستجوی مطلوب و اینکه چگونه از آنها استفاده شود می توان زمان بر باشد.  آشنایی با چنین ابزارهای جستجو کاربران را در دسترسی به اطلاعات در سرتاسر دنیا در روشی کارا و واضح توانمند می سازد. در ابن مقاله سعی شده است که به نمایه سازی تصویر و انواع روش های نمایه سازی تصویر و نظام های تشخیص چهره توجه شود و در پایان موتورهای جستجوی تصویر معرفی گردد.

کلید واژه : موتور جستجوی تصویر ، نمایه سازی، نمایه سازی تصویر

 

 

مقدمه

تا همین اواخر مجموعه تصاویر دیجیتالی به علت محدودیت هایی که در تجهیزات و وسایل چاپ و پخش داشتند زیاد مورد استفاده قرار نمی گرفتند . اما با ورود فناوری های نوین کاربران به کمک آنها توانستند به طور مؤثری تصاویر را ذخیره و بازیابی کنند. پایگاه های اطلاعاتی تصاویر دیجیتالی و فناوری های پردازش تصویر در طی چند سال گذشته به طور چشمگیری توسعه یافته است. پایگاه های اطلاعاتی تصاویر درحال فراهم آوردن دسترسی مؤثر به مجموعه تصاویر هستند. به منظور دسترسی و استفاده از تصاویر، کاربران نیازمند ابزارهای مطمئنی هستند و به علت حجم زیاد اطلاعات جستجوی تصاویر در وب شبیه گشتن به دنبال یک سوزن در انباری از کاه است. ابزاری که می تواند کاربران را کمک کند تا تصاویر مورد نظر خود را بازیابی و جایابی کنند، همانا موتورجستجوی تصویر است (حسن و زنگ،2001). کاربران اینترنتی با تجربه، پرسش خود را با موتورهای جستجوی تخصصی به منظور به دست آوردن نتایج مطلوب شروع می کنند، و زمانی از موتورهای جستجوی عمومی برای پرسش خود استفاده می کنند که موتورهای جستجوی تخصصی نتوانند اطلاعات مفید راجع به پرسش مورد نظرشان بدهد (بیجی و دیگران ، 1998).

 

انواع موتور های جستجو در اینترنت

موتورجستجو یا جستجوگر به طور عمومی به برنامه ای گفته می شود که کلمات کلیدی را در یک سند یا پایگاه اطلاعاتی جستجو می کند . در اینترنت به برنامه ای گفته می شود که کلمات کلیدی موجود در فایل ها و سندهای وب جهانی، گروه های خبری، منوهای گوفر وآرشیوهای FTP را جستجو می کند.

موتور های جستجو به دو دسته کلی زیر تقسیم می شوند:

1.      موتور های جستجوی خودکار: این موتور های جستجو مانند گوگل، فهرست خود را به صورت خودکار تشکیل می دهند. آنها وب را پیمایش کرده، اطلاعاتی را ذخیره می کنند. سپس کاربران از میان این اطلاعات ذخیره شده، آنچه را که می خواهند جستجو می کنند. اگر شما در صفحه وب خود تغییراتی را اعمال کنید موتورهای جستجو خودکار، آنها را به طور خودکار می یابند و سپس این تغییرات در فهرست اعمال خواهد شد. عنوان، متن و دیگر عناصر صفحه همگی در این فهرست قرار خواهند گرفت.

2.      راهنمای های دستی (غیر خودکار): یک راهنمای دستی مانند یک فهرست باز[3]Dmoz وابسته به کاربرانی است که آن را تکمیل می کنند. شما صفحه مورد نظر را به همراه توصیفی مختصر در فهرست ثبت می کنید، یا، این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده انجام می شود . عمل جستجو در این حالت تنها بر روی توضیحات ثبت شده صورت می گیرد و در صورت تغییر روی صفحه وب، روی فهرست، تغییر به وجود نخواهد آورد . آنچه برای بهبود نمایه سازی و رتبه بندی یک موتور جستجو مفید است، تأثیری بر بهبود رتبه بندی یک راهنمای وب ندارد. تنها استثنا این است که یک سایت خوب یا پایگاه داده های با محتوای خوب، شانس بیشتری نسبت به یک سایت یا پایگاه داده ضعیف دارد. البته در مورد کاوشگرهای مشهور مانند گوگل و یاهو یک مؤلفه دیگر هم برای بهبود رتبه بندی وجود دارد که کمک مالی است. یعنی وبگاه هایی که مایل به بهبود مکان وبگاه خود در رده بندی هستند می توانند با پرداخت پول به این کاوشگرها به هدف خویش برسند (ویکی پدیا، 2007)

نمایه سازی تصویر

به خاطر حجم زیاد منابع تصویری، استفاده کننده برای یافتن تصویر علاوه بر موتورهای جستجو، به یک نمایه جامع از تصاویر اینترنت نیاز دارد که بدون آن بازیابی تصویری خاص از اینترنت می تواند خیلی دشوار و زمان بر باشد.

ویژگی ها و خصوصیات منحصر به فرد تصاویر نسبت به سایر منابع اطلاعاتی، کار نمایه سازی تصاویر را با چالش های زیادی مواجه ساخته است . بسر[4]اشاره می کند که دو فاکتور به هم مرتبط، مجموعه تصاویر را از منابع متنی جدا می کند: 1) بسیاری از تصاویر در طبیعت ماهیت چند رشته ای دارند و احتمال دارد که توجه محققان رشته های مختلف را به خود جلب کنند. 2) تصاویر بر خلاف کتاب و دیگر اسناد، با عنوان و مقدمه یا چکیده توصبف نمی شوند؛ این باعث می شود فرد به برداشت شخصی خود از تصویر و محتوای موضوعی آن متکی باشد، که ممکن است شخص در مورد تصاویر سمبولیک وتمثیلی در طبیعت با مشکل مواجه شود. انتخاب نوع نظام نمایه سازی از دیگر مواردی است که می توان به آن اشاره کرد (باکستر، 1995 ). بنابراین، روشن است که نمایه سازی تصاویر فعالیتی آسان و ساده نیست. فراهم کردن نقاط دسترسی متعدد برای کاربرانی که قصد دارند تصاویر را بازیابی کنند مستلزم هزینه فراوان و فعالیتی مداوم است که بسر(1990) اشاره می کند "یک تصویر شاید بهتر از هزاران کلمه باشد، ولی این احتمال وجود دارد که هزاران توصیفگر برای نشان دادن محتوای یک تصویر، کفایت نکند" (باکستر، 1995). (1990)

 

روش های نمایه سازی تصاویر

ذخیره و بازیابی تصاویر از دهه1970 به بعد به نوعی مقوله پژوهشی فعال تبدیل شده و پژوهشگران دو حوزه مدیریت پایگاه اطلاعات و حوزه مهم رایانه دراین زمینه به فعالیت پرداخته اند (نعمت زاده،1382 ). هریک از این گروه با استفاده از برخی ویژگی ها ی تصاویر کوشیده اند تا دسترسی کاربران را به این منابع فراهم سازند. کتابداران و نمایه سازان که به عنوان مدیران پایگاه های اطلاعاتی به شمار می آیند بیشتر به ویژگی های متنی تصویر می پردازند، یعنی رویکردی مبتنی بر متن دارند (نعمت زاده،1382). روش دیگر به ویژگی های محتوای تصویر می پردازد، یعنی رویکردی مبتنی بر محتوا دارد.

 

بازیابی و نمایه سازی مبتنی بر متن

بازیابی و نمایه سازی مبتنی بر متن می تواند بر اساس فنون قدیمی بازیابی اطلاعات متنی باشد. با این حال برای بهبود انجام بازیابی، شخص باید با روش استفاده از ساختار اسناد HTML آشنایی داشته باشد، به خاطر اینکه کلمات و اصطلاحاتی که در موقعیت های مختلف از یک سند HTML حضور می یابند، سطوح مختلفی از اهمیت یا ربط را با تصاویر مرتبط دارند. بنابراین فرد باید کلمه مناسب بر اساس موقعیت های کلمه اختصاص دهد. ما نیز لازم است برچسب ها و اصطلاحات مناسبی که به طور مستقیم با تصاویر مرتبط هستند، اختصاص بدهیم .

 

شیوه بازیابی تصاویر در نظام های بازیابی تصویر مبتنی بر متن برروی وب

اطلاعات مورد نیاز برای یافتن تصاویر بر روی وب جهان گستر را به طور کلی از دو منبع می توان به دست آورد: متن مربوط به تصویر و خود تصویر. هنگام استفاده از اطلاعات این دو منبع، برنامه ای باید بتواند با موفقیت تصاویر درخواستی را بازیابی کند که آن برنامه موتورهای جستجوی تصاویر هستند. در نظام مبتنی بر متن اطلاعات مریوط به متن خود تصویر بر اساس موقعیت هایشان رده بندی می شوند که بر اساس گروه های زیر است:

1.      نام فایل تصویر[5]: نام های فایل شامل عبارات مهمی در رابطه با محتوای فایل هستند، در موارد زیادی، آدرس جاینمای جهانی[6]http://www2.int_every.fr/~hug/images/marilyn/mmtrans.gif ”) ) شامل اطلاعات بیشتری به نسبت یک URL وابسته است (e. g. “mm –trans .gif ” ) ، که ممکن است در منبعHTML قرار داده شده باشد.   یک تصویر

2.      عنوان تصویر[7] : اغلب تصاویر شامل عناوینی هستند که تصاویر را توصیف می کنند. اگر چه زبانHTML

/ 0 نظر / 42 بازدید