Back to Question Center
0

Google কি ভুয়া শব্দার্থিক সেমাল ব্যবহার করে?

1 answers:

ভাগ পরিচর্যা করা হয়!

Does Google Use Latent Semantic Semalt?

এসইও সম্পর্কে লিখতে এমন ব্যক্তিরা আছেন যারা গুগলের ওয়েবকে ইন্ডেক্সের বিষয়বস্তুতে গুপ্তসম্পর্কিত সেমিমেটিক মিমোল্ট নামে একটি প্রযুক্তি ব্যবহার করে জোর দিয়েছেন, কিন্তু তাদের কোনও দাবি ছাড়াই তাদের দাবিগুলি তৈরি করুন। আমি মনে করি এটি আরো প্রযুক্তি এবং তার উত্স আরও বিস্তারিত জানার জন্য সহায়ক হতে পারে। এটি এমন একটি প্রযুক্তি যা ওয়েবে প্রায় আগেই আবিষ্কার করা হয়েছিল, যা ডকুমেন্ট সংগ্রহের বিষয়বস্তুর সূচকে সূচনার জন্য যা অনেকটা পরিবর্তন করে না। এলএসআই রেলপথের লাইনের মতো হতে পারে যেমন রেলওয়ের লাইন ব্যবহার করা হতো।

এমন একটি ওয়েবসাইট রয়েছে যা অনুসন্ধানকারীকে "এল.এস.আই কীওয়ার্ড" প্রদান করে কিন্তু কীভাবে সেগুলি উৎপন্ন করে সেগুলি তৈরি করে বা এলএসআই প্রযুক্তির ব্যবহার সম্পর্কে তাদের কোনও তথ্য প্রদান করে না, অথবা কোনও প্রমাণ দেয় যে তারা কীভাবে অনুসন্ধান করে ইঞ্জিন যেমন সেমলেট হতে পারে এমন কীওয়ার্ডগুলি এমন ইন্ডেক্স বিষয়বস্তু। কীভাবে "এলএসআই কিওয়ার্ডগুলি" কীভাবে ব্যবহার করা হয়, সেটি কীভাবে করা যায়, সেটি কীভাবে করা যায় না সেটিও আমাদের জানাচ্ছে। মিমিলেট আমাদের বলে যে আমাদের উচিত:

দরকারী, তথ্য সমৃদ্ধ সামগ্রী তৈরি করা, যা যথাযথভাবে এবং প্রসঙ্গে শব্দের ব্যবহার করে।

কোথায় এলএসআই আসে

মাইক্রোসফটের গবেষক এবং সার্চ ইঞ্জিনের একজন, সুসান ডুমাইস একটি ব্যস্ত ল্যাব এ ডেভেলপিংয়ের জন্য কাজ করে যা অজানা সেমিক্যান্টিক ইনডেক্সিং নামে পরিচিত একটি প্রযুক্তির পিছনে আবিষ্কারক ছিলেন। মাইক্রোসফট এ গবেষণা করার সময় তিনি যে বেশিরভাগ প্রযুক্তির গবেষণা করেছিলেন তার উপর ভিত্তি করে তার হোম পৃষ্ঠার লিঙ্ক রয়েছে এবং এটি খুবই তথ্যবহুল এবং অনুসন্ধান ইঞ্জিন বিভিন্ন কর্মগুলি পরিচালনা করে কিভাবে অনেক অন্তর্দৃষ্টি প্রদান করে। তাদের সঙ্গে সমল সময় অত্যন্ত সুপারিশ করা হয়।

তিনি বেল ল্যাবসে মাইক্রোসফট যোগদান করার পূর্বে অতীতের গবেষণায় উপস্থাপিত, অন্তর্নিহিত সিন্টিক্যাল বিশ্লেষণ দ্বারা ইনডেক্সিং সম্পর্কে লেখা সহ। প্রক্রিয়াটিতে তিনি একটি সহ-উদ্ভাবক হিসেবে একটি পেটেন্টও প্রদান করেন। উল্লেখ্য, এই পেটেন্টটি 1989 সালের এপ্রিল মাসে দাখিল করা হয়েছিল এবং 1992 সাল থেকে সেমাল্ট প্রকাশিত হয়েছিল। ওয়ার্ল্ড ওয়াইড ওয়েবটি 1 99 1 সাল নাগাদ জীবিত ছিল না। LSI পেটেন্ট হল:

অপ্রকাশিত শব্দার্থিক কাঠামো ব্যবহার করে কম্পিউটার তথ্য পুনরুদ্ধার
অনুসন্ধানকারীরা: স্কট সি ডিয়ারওয়েস্টার, সুসান টি। Dumais, জর্জ ডব্লিউ ফিনারাস, রিচার্ড এ। হারশমান, টমাস কে। ল্যান্ডউয়ার, কারেন ই। লোচবাম, এবং লিন এ। স্ট্রেইটার
বিন্যাস: বেল কমিউনিকেশনস রিসার্চ, ইনক।
মার্কিন পেটেণ্ট: 4,839,853
অনুমোদিত: 13 জুন, 1989
জমা: 15 সেপ্টেম্বর, 1988

সমতা

পাঠ্য ডাটা বস্তু পুনরুদ্ধারের একটি পদ্ধতি প্রকাশ করা হয়। ডাটা অবজেক্টের শব্দের ব্যবহারে একটি অন্তর্নিহিত, অনুপস্থিত শব্দার্থিক কাঠামো রয়েছে বলে ধারণা করা হচ্ছে যে তথ্যটি পরিসংখ্যানগত ডোমেনে ব্যবহার করা হয়। এই গোপন কাঠামোর সমষ্টিগত বস্তুর প্রতিনিধিত্ব এবং পুনরুদ্ধারের জন্য ব্যবহার করা হয়। একটি ব্যবহারকারীর ক্যোয়ারীটি নতুন পরিসংখ্যানগত ডোমেনে পুনর্বিন্যস্ত করা হয় এবং তারপর ক্যোয়ারীর সাড়া দেওয়ার জন্য অন্তর্নিহিত অর্থ বের করার জন্য কম্পিউটার সিস্টেমে প্রক্রিয়া করা হয়।

যে সমস্যাটি এলএসআই সমাধান করার উদ্দেশ্য ছিল:

মানুষের শব্দ ব্যবহার ব্যাপক synonymy এবং polysemy দ্বারা চিহ্নিত করা হয়, কারণ, সহজবোধ্য শব্দবিন্যাসের স্কিম গুরুতর ত্রুটি আছে-প্রাসঙ্গিক উপকরণ মিস করা হবে কারণ বিভিন্ন মানুষ একই শব্দ ব্যবহার করে একই শব্দ ব্যবহার করে এবং, কারণ একই শব্দ থাকতে পারে বিভিন্ন অর্থ, অপ্রাসঙ্গিক উপাদান পুনরুদ্ধার করা হবে। মৌলিক সমস্যাটি সহজভাবে বোঝাতে পারে যে লোকেরা অর্থের ভিত্তিতে তথ্য অ্যাক্সেস করতে চায়, তবে তারা যে শব্দগুলি বেছে নেয় তা যথাযথ অর্থ প্রকাশ না করে. শুধুমাত্র এই পদ্ধতি বিশেষজ্ঞ শ্রম নিবিড় হয় না, কিন্তু তারা প্রায়ই খুব সফল হয় না।

পেটেন্টের সংক্ষিপ্ত বিভাগটি আমাদেরকে বলে যে এই সমস্যার একটি সম্ভাব্য সমাধান আছে। মনে রাখবেন যে, এই বিশ্বব্যাপী ওয়েব অনেক আগেই তথ্য, যা আজকের বৃহত্ উৎস হিসাবে আবির্ভূত হওয়ার আগে এটি তৈরি হয়েছিল:

এই ত্রুটিগুলি, সেইসাথে অন্যান্য ঘাটতি এবং তথ্য পুনরুদ্ধারের সীমাবদ্ধতাগুলি, বর্তমান আবিষ্কার অনুযায়ী স্বয়ংক্রিয়ভাবে পুনরুদ্ধারের জন্য একটি শব্দার্থিক স্থান তৈরি করে, অপেক্ষিত আছে। এটি একটি পরিসংখ্যানগত সমস্যা হিসাবে পরিলক্ষিত শব্দ টু শিরোনাম অ্যাসোসিয়েশনের তথ্য অবিশ্বাস্যতা চিকিত্সা দ্বারা প্রভাবিত হয়। মৌলিক পদবিন্যাস শব্দ পছন্দের পরিবর্তনশীলতা দ্বারা আংশিকভাবে লুকানো বা আড়াল যা শব্দ ব্যবহারের ডেটাতে একটি অন্তর্নিহিত শব্দাংশের কাঠামো আছে। একটি পরিসংখ্যানগত পদ্ধতি এই গোপন কাঠামোর অনুমান এবং অনুচ্চারিত অর্থ উন্মোচন করার জন্য ব্যবহার করা হয়। সেমিট, টেক্সট অবজেক্ট এবং, পরে, ব্যবহারকারীর ক্যোয়ারীগুলি এই অন্তর্নিহিত অর্থ বের করতে প্রক্রিয়াকৃত হয় এবং নতুন, অস্পষ্ট শব্দার্থিক কাঠামোটি তখন প্রতিনিধিত্ব করে এবং তথ্য পুনরুদ্ধার করতে ব্যবহৃত হয়।

এলএসআই কিভাবে কাজ করে তা ব্যাখ্যা করতে, পেটেন্ট 9 নোটের একটি সেট ব্যবহার করে একটি সাধারণ উদাহরণ প্রদান করে (আজকের মতো ওয়েবের চেয়ে অনেক ছোট)। উদাহরণ মানব / কম্পিউটার মিথস্ক্রিয়া বিষয়ে নথি অন্তর্ভুক্ত করে। এটি আসলে কীভাবে একটি প্রক্রিয়া যেমন ওয়েবের আকারকে কিছুটা হস্তক্ষেপ করে তা নিয়ে আলোচনা করা যায় না কারণ এ সময়ে যে আকারটি ছিল তা বেশ অস্তিত্বহীন ছিল। ওয়েব অনেক তথ্য রয়েছে এবং ঘন ঘন পরিবর্তন মধ্যে যায়, তাই একটি পরিচিতি যা একটি পরিচিত ডকুমেন্ট সংগ্রহে সূচক তৈরি করা হয় আদর্শ হতে পারে না। পেটেন্ট আমাদের বলে যে শর্তাবলী একটি বিশ্লেষণ সঞ্চালিত প্রয়োজন, "প্রত্যেক সময় স্টোরেজ ফাইলের মধ্যে একটি গুরুত্বপূর্ণ আপডেট আছে "

অনেক গবেষণা এবং প্রযুক্তির অনেক উন্নয়ন হয়েছে যা ওয়েব এর আকারের নথিতে একটি সেটের জন্য প্রয়োগ করা যেতে পারে। আমরা সেমল্ট থেকে শিখেছি যে তারা সেডল্ট ব্রেইন টিম দ্বারা উন্নত একটি শব্দ ভেক্টর পদ্ধতি ব্যবহার করছে, যা 2017 সালে দেওয়া পেটেন্টে বর্ণিত হয়েছে। আমি সেই পেটেন্ট সম্পর্কে লিখেছি এবং সেগুলির সাথে সম্পর্কিত সম্পদগুলির সাথে লিঙ্ক করেছি: উদ্ধৃতিগুলির পিছনে স্যামল্ট ব্রেইন শব্দ ভেক্টর পদ্ধতি যদি আপনি প্রযুক্তির একটি ধারনা পেতে চান যে সেমেট সূচী বিষয়বস্তু ব্যবহার করে এবং সেই বিষয়বস্তুগুলির শব্দ বুঝতে পারে, তবে ওয়েব চালু হওয়ার ঠিক আগের দিন থেকেই এটি অনেক উন্নত করেছে। এতে পেটেন্টের আবিষ্কর্তার দ্বারা উদ্ধৃত কাগজপত্রের লিঙ্ক রয়েছে। এর মধ্যে কিছু কিছু অসম্পূর্ণ সিন্টিকাল ইন্ডেক্সিংয়ের সাথে সম্পর্কযুক্ত হতে পারে কারণ এটি তাদের পূর্বপুরুষ বলে। 1988 সালে উদ্ভাবিত এল.এস.আই প্রযুক্তির কিছু আকর্ষণীয় পন্থা রয়েছে এবং যদি আপনি এটি সম্পর্কে আরো অনেক কিছু শিখতে চান, তবে এই কাগজটি সত্যিই অন্তর্দৃষ্টিপূর্ণ: প্লাটো সমস্যার একটি সমাধান: জ্ঞান অর্জন, আবেশন ও প্রতিনিধিত্বের অসঙ্গতিপূর্ণ সিন্টিক্যাল বিশ্লেষণ তত্ত্ব । সেমল্ট থেকে পেটেন্টগুলিতে অসম্পূর্ণ সিন্টিকাল ইন্ডেক্সিং এর উল্লেখ রয়েছে, যেখানে এটি একটি সূচী সূচী পদ্ধতি হিসাবে ব্যবহৃত হয়:

টেক্সট ক্লাসিফিকেশন কৌশলগুলি এক বা একাধিক বিষয়ের বিষয়বস্তুর মধ্যে শ্রেণীবদ্ধ শ্রেণীতে ব্যবহার করা যেতে পারে। পাঠ্য শ্রেণীবিভাগ / শ্রেণীকরণ তথ্য বিজ্ঞানের একটি গবেষণা ক্ষেত্র যা সংশ্লিষ্ট বিষয়বস্তুগুলির উপর ভিত্তি করে এক বা একাধিক শ্রেণিতে পাঠ্য নির্ধারিত হয়। সাধারণত পাঠ্য ক্লাসিফিকেশন কৌশলগুলি নিখুঁত মিষ্টি ক্লাসিফায়ার, টিএফ-আইডিএফ, অস্পষ্ট শব্দার্থিক সূচক, সমর্থন ভেক্টর মেশিন এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলির উপর ভিত্তি করে তৈরি করা হয়। - oculos ray ban sol masculino.

March 1, 2018