فال

قالب وبلاگ

قالب وبلاگ

اس ام اس عاشقانه

نمایه سازی تصویر در پایگاههای اطلاعاتی 2 - نمایه


نمایه
 
پيوند ها

محل درج آگهی و تبلیغات
 
نوشته شده در تاريخ چهارشنبه ٤ اسفند ۱۳۸٩ توسط نمایه

نمایه سازی تصویر در پایگاههای اطلاعاتی

بخش دوم

اصطلاحنامه بصری و سیستم های ترکیبی وابسته

استفاده از اصطلاحنامه بصری در سالهای اخیر مورد توجه قرار گرفته و موضوع تحقیقات بسیار قرار گرفته است و البته باید یاداوری کرد که در سیستم هایی که به طور آزمایشی از اصطلاحنامه بصری استفاده کرده اند کلمات به طور کامل حذف نشده است.

از نمونه های اصطلاحنامه بصری می توان مرکز فضایی (NASA Johnson (JSC در هوستون[۲۵] اشاره کرد , این سیستم برای بازیابی تصاویر مجموعه های فضایی طراحی شده این سیستم یک رویکرد متنی سنتی تر را دنبال می کند دست اندرکاران این سیستم بر این باورند که این سیستم با سایر پایگاههای اطلاعاتی تصویری متفاوت است این سیستم عملگرهای بولی را به کار نمی برد در عوض از موتور بازیابی داده های سیستم[۲۶] استفاده می کند این سیستم از شمار زیادی از الگوریتمهای جستجوی آماری استفاده می کند که تصاویر بازیابی شده را بر حسب شباهت به سوال مرتب می کنند در نتیجه احتمال اینکه کاربر تصویری مرتبط با آنچه که به دنبالش است پیدا کند افزایش می یابد.

این سیستم از حدود ۲۰۰ تصویر رایج ساخته شده که از نرم افزار هیپرکارد[۲۷] استفاده می کند که کلید واژه کاربر را با اصطلاحات مرتبط در تزاروس JCC(که یک تزاروس سلسله مراتبی از لغات هوانوردی که برای استفاده خانگی ناسا[۲۸] تهیه شده), پیوند می زند. در نتیجه گزینش اصطلاحات توصیفی در تزاروس , تصاویر مرتبط و همان طور تصاویر عام تر و خاص تر در پایگاههای اطلاعاتی بازیابی می شود . هرچند این نمونه بدون مشگل نیست ولی سازوکار آماری مذکور به طور اتوماتیک مهمترین تصاویری که به اصطلاحات تزاروس مرتبط شده اند را بازیابی می کند.

تحقیقات نشان می دهد تزاروس بصری بیشتر برای مصارف اتفاقی و کاربران بی تجربه تر مفید است حال آنکه رویکرد تزاروس متنی برای کاربران با تجربه تر مفید است . سیستم دیگری که در زمینه تزاروس بصری کارمی کند در دانشگاه سیراکوس[۲۹] است که هدف از ایجاد این سیستم ایجاد تزاروس بصری مفهومی با تمرکز روی تصاویر طراحی شده بود آنها دنبال سیستمی هستند که در شناسایی برگ گیاهان و اجزای آن به کاربران کمک کند در این سیستم در ابتدا برای کاربران گستره ای از تصاویر که برگهای اصلی و شکلهای آنها را شرح می دهد نمایش داده می شود کاربر یکی از این نمونه ها را انتخاب می کند و سپس می تواند این نمونه را اصلاح و دستکاری کند و در نهایت پس از اصلاحاتی که کاربر روی آن انجام می دهد تصویر اصلاح شده, برا ی کاربر نمایش داده می شود برای انجام این کار این سیستم از مجموعه ای از نرم افزارهای رایج در طراحی کامپیوتر ها مانند استفاده می کند کنترل پوینتز[۳۰]و هندلس[۳۱] استفاده می کند(باکستر,۱۹۹۵).

البته نمونهای دیگری از تزاروس های بصری وجود دارد که هنوز چندان توسعه نیافته است.

زبانهای توصیف تصویر

برخی محققان به دنبال روش های جایگزین برای نمایه سازی دستی تصاویر هستند و بر این باورند که مناسب ترین روش برای ذخیره و بازیابی متوالی و اتوماتیک استفاده از زبانهای تخصصی است که توصیف یک تصویر را بر عهده گیرند می باشند که این زبان به وسیله کد ماشین خوان در دانشگاه لندن به طور آزمایشی به کار رفت آنها یک زبان توصیف تصویر که مبتنی بر مدل داده ای روابط بر مبنای خصیصه موجودیت ها[۳۲] است و اشاره می کنند که این زبان ممکن است مشابه سیسم کلیدی که دربخش خصیصه[۳۳] و عمل تاثیر[۳۴]استفاده می شود باشد و این سیستم درچکیده استینز [۳۵] مطابق با دقت برای اسم وصفت وفعل که عموما یک توصیف ساده از یک تصویر را ارائه می دهد می باشد استفاده از یک بخش از قوانین ارائه شده به نحو تخصصی نشان می دهد که مشابه با آن چیزی که در PRECIS (چکیده) استفاده می شود این زبان توصیف تصویر را برای ساختار دهی به روش یکنواخت را ممکن می سازد و همچنین روابط بین موضوعات را در یک تصویر ممکن می سازد که استفاده از آن را به عنوان معیار بازیابی مجاز می کند.

هرچند این زبان توصیف تصویر برای مجموعه های کوچک عملی است ولی همچنان برای نمایه سازی مدخلها و نیازهای کاربران ما ناچار هستیم ورود اطلاعات و کدگذاری را به شیوه دستی انجام دهیم و کاربرد این زبان در مجموعه های بزرگ ممکن است پیچیده و زمان گیر باشد(باکستر,۱۹۹۵).

بازیابی و نمایه سازی تصاویر توسط محتوا

اخیرا تحقیقات زیادی برای توسعه سیستم هایی صورت گرفته که به جای تکیه بر توصیف تصویر از طریق متن تصاویراز تحلیل اتوماتیک محتوا و مچ کردن تصاویر با توجه به سوال کاربر استفاده کنند بیشتر این سیستم ها مبتنی بر تحلیل ریاضی و آرایه پیکسلهایی است که یک تصویر دیجیتالی را تشکیل می دهد می باشد(باکستر,۱۹۹۵).

بازیابی تصاویر محتوایی یا CBIR در سالهای اخیر تلاشهای زیادی را به خود معطوف کرده و برای استخراج سریعتر استفاده می شود این سیستم متکی بر خواص قابل سنجش مثل رنگ , شکل و متن است با CBIR تصاویر با کیفیت مشابه می توانند جمع آوری شوند این سیستم رویکرد مفیدی برای بازیابی علائم تجاری دارد ولی در مورد اسامی کمتر مفید است (,۲۰۰۲ The Future of).

در CBIR سوال کاربر به دو شکل زیر تفسیر می شود

۱) یک تصویر مشابه با آنچه که مورد نیاز و از قبل با هدف مچ کردن در سیستم وجود دارد بازیابی شود.

۲) یک سوال ساختار مورد دلخواه خواسته شده را شرح می دهد

از بین سیستم های CBIR می توان به سیستمی اشاره کرد که توسط ریکمن[۳۶]و استون هام[۳۷] در دانشگاه برونل[۳۸] توسعه یافته این سیستم مبنایش از پروژه ویزارد[۳۹] و استون هام[۴۰] می باشد این سیستم توسط الگوی انطباق یک تصویر ورودی از صورت انسان با مجموعه ای از تصاویر سیاه سفید که در یک پایگاههای اطلاعاتی تصویر صورت انسان وجود دارد کار می کند این سیستم از یک شبکه عصبی ۸ گرهی استفاده می کند تلاشهایی برای شبیه کردن این واکنش با واکنش فرآیند مغزی صورت گرفته است. فرایند کاری این پایگاههای اطلاعاتی بسیار پیچیده است(باکستر,۱۹۹۵).

سیتم دیگر CBIR, VisualSEEk and WebSEEk می باشد این دو سیستم سیستم هایی هستند که برای استفاده در وب جهان گستر طراحی شده اند و اجازه می دهند که در خواستها از طریق کلید واژه ها و ویژگیهای بصری وارد این سیستم ها شوند هر دو این سیستم ها در دانشگاه کلمبیا توسعه یافته اند و از طریق free trials قابل دسترس هستند(,۲۰۰۲ The Future of).

Excalibur RetrievalWare سیستمی است که به کاربران اجازه می دهد که در جستجوی تصاویر بر رنگ , شکل ظاهری وضوح و وزن نسبی متکی باشند و هر ویژگی می تواند برای دقت بیشتر خودش را تطبیق دهد.

امید بخش تر تولیداتی است که ویژگیهای کلامی را با ویژگیهای بصری ترکیب کند چنانچه رای[۴۱] می گوید اختلاف اصلی بین یک سیستم بازیابی کامپیوتری و سیستم بازیابی تصویری این است که انسان یک بخش غیر قابل اجتناب در سستم های بعدی است (,۲۰۰۲ Future (The.

در حال حاضر بر ترکیب این دو شیوه یعنی ویژگیهای کلامی و بصری تاکید می کنند شرکت رور و همکاران در دانشگاه دریایی آمریکا بر روی نمایه سازی تصاویر کار کردند و در روش آنها تر کیبی از متن و ویژگیهای پیکسلی استفاده شده بود و برای اعمال طبقه بندی محلی بر روی عکسها از یک الگوی شبکه عصبی استفاده شده بود و از فرایند تجزیه خودکار برای شرح تصاویر استفاده شده بود.

در حال حاضر برخی سیستمها توسعه یافته اند که می خواهند برای نمایه سازی تصاویر از بازخورد کاربر استفاده کنند ابیلوا[۴۲] پیشنهاد می کند که از فیدبک کاربران شناسایی نتایج جستجو یمرتبط و غیر مرتبط استفاده کرد به طور مثال ارباچ یکی از چند نویسنده ای است که به ضرورت نمایه سازی مجموعه های تصاویر از دیدگاه بهره گیران تاکید می کند و ترنر اصطلاحاتی که بهره گیران برای استفاده در تصاویر انتخاب می کنند با توصیف کوتاه نوشته شده درباره تصاویرمقایسه کرد او به سطح بالایی از همخوانی رسید.

در حال حاضر یکی از سیستمهای بسیار موفق در بازار QBIC است که توسط شرکت IBM توسعه یافته این سیستم به کاربران اجازه می دهند که تصاویر مرتبط را به وسیله کشیدن آنچه که در ذهن دارند جستجو کنند و یا از طریق گزینش تصویر مرتبط از روی الگوهای متنی و رنگی آن را بازیابی کنند QBIC یک سیستم نیمه اتوماتیک است که از رنگ و متن و شکل برای نمایه سازی و بازیابی تصاویر استفاده می کند این سیستم از یک رابطه گرافیکی استفاده می کندسیستم کیوبیک انواع مختلفی از درخواسته های تصویری را فراهم »ی اورد . دو درخواست عام تر عبارتند از درخواست شییء و درخواست تصویری . درخواستهای شییء تصاویری را بازیابی می کنند که اشیای تصویری آنها با مشخصه های درخواست انتطباق دارد مثل یافتن شکلهایی که قرمز و گرد هستند .در حالی که درخواستهای تصویری , ویژگیهای کلی تصویر را بازیابی می کنند مثل یافتن تصاویری که بیشتر رنگ مایه قرمز و آبی دارند برای انجام درخواست های شییء باید اشیا را در هر صحنه و عموما از طریق ترسیم نقشه کلی آن قبل از درخواستها شناسایی کرد. فرآیند ترسیم نقشه کلی اشیا و سپس محاسبه صفات یا مشخصه های هر شییء و هر تصویر به عنوان یک کل را طبقه بندی تصویری گویند .ابزارهای طراحی پایه ای مثل چهار ضلعی , بیضی, چند ضلعی , قلم موی نقاشی و یک ابزار مارپیچ (که نقشه کلی تصاویر انتخابی را ترسیم می کند) وجود دارند یک ابزار پرکردن[۴۳] از طریق ترسیم خودکار نقشه کلی پیکسل هایی شبیه به پیکسل انتخابی پوشش دادن تصاویری با کنتراست بالا را تسریع می کند(لنکستر,۱۳۸۲, ۳۱۸)

به طور کلی می توان گفت گرچه روشهای غیر کلامی برای بازیابی تصاویر وجود دارند اما احتمالا بتوان از نمایه سازی و بازیابی کلمه پایه ای معمول در بسیاری از جستجوها استفاده کرد و اگرچه ایده جستجو از طریق تصویر بسیار توصیه شده است اما این روش همیشه نمی تواند جایگزین قدرت توصیفی کلمات باشد که ممکن است برای برخی از مفاهیم موجز مناسب تر باشد.

به عبارت دیگر متن یک خلاصه بصری می تواند اطلاعات با ارزشی را فراهم آورد که در تصویر وجود ندارد بنابراین اگرچه بازیابی تصویری منطقا برای دستیابی سریع به تصاویر مناسب است اما این بدان معنی نیست که این روش جانشین خلاصه متن خواهد شد.

نتیجه گیری

دستیابی توافق بر روی نمایه سازی تصاویر دشوار است زیرا افراد نمی توانند بر روی آنچه که یک تصویر واقعا نشان می دهد موافقت داشته باشند حتی برخی افراد مثل شات فورد بین آنچه در تصویر وجود دارد و چیزیکه از آن صحبت می کند تمایز قائل شده اند زیرا آنچه در تصویر وجود دارد کم و بیش با مسائل عینی روبروست حال آنکه آنچه یک تصویر از آن صحبت می کند بیشتر با امور انتزاعی سروکار دارد.

دیده شده که راه حل پیشنهادی برای مشکلات بازیابی تصاویر خیلی متنوع است و هرکدام از این روشها مزایا و مشکلاتی دارند بنابراین برخی نوسیندگان بین نمایه سازی شفاهی (یعنی بازنمود متنی یک تصویر) و نمایه سازی تصویری(استخراج مشخصه ها و در نتیجه نقاط دسترسی از خود تصویر) تفاوت قائل شده اند و این تمایز کاملا روشن است و یک سیستم بازیابی تصویر می تواند هر دونوع نمایه سازی را در بر داشته باشد و برخی دیگر تاکید کرده اند که بازیابی کارامد تصاویر فقط بر اساس انطباق صرف تصویرحاصل نمی آید و هنوز نوعی برچسب گذاری متنی ضرورت دارد مناسب ترین روش حداقل برای برخی اهداف ممکن است روشی باشد که دستیابی معمول از طریق متن (اصطلاحات نمایه ای با شرح توصیفی) را با انطباق تصویری در هم آمیزد وروش عملی استفاده از یک اصطلاحنامه تصویری است اصطلاحنامه ای که تصاویر نمونه را همراه با برچسب های شفاهی یا احتمالا بدون برچسب های شفاهی ذخیره کند.

 

پانوشتها:


[۱] . Kohn
[
۲] . Erin Panafski
[
۳] . Pre Icongraph
[
۴] . Icongraph
[
۵] . Icongraphical
[
۶] Markie
[
۷] Shutford
[
۸] Van der Starre
[
۹] .Luraine Tansey
[
۱۰] .Wendell Simons
[
۱۱] . Santa Cruz
[
۱۲] .Hance C. Rahn
[
۱۳] .Belmont
[
۱۴] . Icongraph
[
۱۵] .Besser
[
۱۶] .Dora Couch
[
۱۷] . Peterson
[
۱۸] Agents
[
۱۹] Henry Van de Wall .
[
۲۰] .University of Leiden
.[
۲۱] Couprie
[
۲۲] . Sunderland
[
۲۳] . Evans
[
۲۴] . formal
[
۲۵] Houston
[
۲۶] . system’s data retrieval engine
[
۲۷] Hypercard
[
۲۸] NASA
[
۲۹] Syracuse
[
۳۰] control points
[
۳۱] handles
[
۳۲] Entity Attribute Relationship
[
۳۳] part/property
[
۳۴] action/effect
[
۳۵] Austin’s PRECIS
[
۳۶] Rickman
[
۳۷] Stonham
[
۳۸] Brunel
[
۳۹] Wizard
[
۴۰] Stonham
[
۴۱] Rai
[
۴۲] Eubilva
[
۴۳] Fill Tools


فهرست منابع :


۱. "A Brief History of Image Analysis".۲۰۰۲[on line].available:
http://www.slais.ubc.ca/people/students/student rojects/C_Wanczycki/libr
۵۱۷/history.html
۲. Baxter, Graeme(۱۹۹۵)." Image indexing and retrieval: some problems and proposed solutions"[on line].available:
http://www.emeraldinsight.com/Insight/ViewContentServlet?Filename=Published/EmeraldFullTextArticle/Articles/
۱۷۲۰۰۶۰۴۱۱.html
۳."TGM: Thesaurus of Graphic Materials".۲۰۰۲[on line].available:
http://www.slais.ubc.ca/people/students/student projects/C_Wanczycki/libr
۵۱۷/tgm.html .
۴." The AAT: The Art and Architecture Thesaurus".۲۰۰۲[on line].available:
http://www.slais.ubc.ca/people/students/student projects/C_Wanczycki/libr
۵۱۷/aat.html
۵." The Future of Image Indexing".۲۰۰۲[on line].available:
http://www.slais.ubc.ca/people/students/student projects/C_Wanczycki/libr
۵۱۷/future.html
۶. "Useful Comparisons: Benefits and Limitations of AAT and TGM".۲۰۰۲[on line].available:
http://www.slais.ubc.ca/people/students/student projects/C_Wanczycki/libr۵۱۷/comparison.html

 

منبع: پژوهشگاه اطلاعات و مدارک علمی ایران


.: Weblog Themes By Pichak :.





تمامی حقوق این وبلاگ محفوظ است | طراحی : پیچک
فال حافظقالب وبلاگقالب وبلاگگالری عکسفاگالری عکس آلامتو