عنوان مقاله :
چارچوبی برای انتقال مجموعه داده های رابطه ای به NoSQL
اطلاعات مقاله :
ELSEVIER - سال 2015
تعداد صفحات ترجمه : 14 صفحه
تعداد صفحات انگلیسی : 10 صفحه
http://forosh-maghale.sellfile.ir/
چکیده انگلیسی :
In software development, migration from a Data Base Management System (DBMS) to another, especially with distinct characteristics, is a challenge for programmers and database administrators. Changes in the application code in order to comply with new DBMS are usually vast, causing migrations infeasible. In order to tackle this problem, we present NoSQLayer, a framework capable to support conveniently migrating from relational (i.e., MySQL) to NoSQL DBMS (i.e., MongoDB). This framework is presented in two parts: (1) migration module; and, (2) mapping module. The first one is a set of methods enabling seamless migration between DBMSs (i.e. MySQL to MongoDB). The latter provides a persistence layer to process database requests, being capable to translate and execute these requests in any DBMS, returning the data in a suitable format as well. Experiments show NoSQLayer as a handful solution suitable to handle large volume of data (e.g., Web scale) in which traditional relational DBMS might be inept in the duty
چکیده
در توسعه نرم افزار، انتقال از یک سیستم مدیریت پایگاه داده (DBMS) به دیگری، به خصوص با ویژگی های متمایز، یک چالش برای برنامه نویسان و مدیران پایگاه داده است. تغییرات در کد برنامه به منظور تطابق باDBMS جدید معمولا گسترده است و، باعث انتقال غیر عملی می شود. به منظور مقابله با این مشکل، ما چارچوبی به نام NoSQLayer را ارئه می دهیم که قادر به پشتیبانی از تسهیل انتقال از رابطه ای (به عنوان مثال، خروجی) به NoSQL DBMS (به عنوان مثال، مانگودیبی) است. این چارچوب در دو بخش ارائه شده است: (1) ماژول انتقال؛ و، (2) ماژول نگاشت. یکی از اولینها، مجموعه ای از روشها است که قادر به انتقال بی وققه بین DBMS ها (به عنوان مثال MySQL به مانگودیبی) است. دومی یک لایه پایداری برای پردازش درخواستهای پایگاه داده، ارائه می دهد که قادر به ترجمه و اجرای این درخواست ها در هر DBMSاست و داده ها در فرمت مناسب باز می گردند. آزمایش ها NoSQLayer را عنوان یک تعداد اندک راه حل مناسب برای رسیدگی به حجم زیادی از داده ها (به عنوان مثال، مقیاس وب) نشان می دهند که DBMSرابطه ای سنتی ممکن است در انجام کار خویش بی منطق باشد.
1-مقدمه
نسل جدید برنامه های کاربردی نرم افزار، طراحی شده برای برآورده کردن خواسته هایی از گروه های کوچک کاربران و یا سازمان های بزرگ، است که مجبور به مقابله با رشد بزرگی در حجم داده برای پردازش و ذخیره سازی است...
عنوان مقاله :
پایگاه داده های رابطه ای در برابر NoSQL: یک بررسی
اطلاعات مقاله :
International Journal of Computer and Information Technology (ISSN: 2279 – 0764)
Volume 03 – Issue 03, May 2014
تعداد صفحات ترجمه : 7 صفحه
تعداد صفحات انگلیسی : 4 صفحه
خرید ترجمه مقاله به قیمت 6 هزار تومان
چکیده انگلیسی :
The huge growth in the Internet market and the emerging of the new web technologies and the trend toward what is called web 2.0 and recently web 3.0 come with a new challenges, new applications and new concepts such as NoSQL databases which is recently becomes a very popular as an alternative to the relational databases specially in dealing with large data
which is one of the most common features of web today, providing high availability and scalability to the distributed systems which need fast access time and can’t tolerate any down time during failures and have been used heavily by the big enterprises and web companies such as Facebook, amazon and google. Every new technology faced many challenges like Security vulnerabilities. This paper addresses the concepts of NoSQL, the movement, motivations and needs behind it, and reviews the types of NoSQL databases and the issues concerning to these databases mainly areas of application and the security issues compared with traditional relational databases
چکیده
رشد بسیار در بازار اینترنتی و تعبیه تکنولوژی های جدید وب و تمایل به سمت چیزی که به آن وب 2 گفته می شود و اخیراً وب 3 با چالش های جدید آمده، برنامه های کاربردی جدید و مفاهیم جدیدی مانند پایگاه داده های NoSQL گه اخیراً بعنوان جایگزین بسیار محبوب برای پایگاه داده های رابطه ای به ویژه در ارتباط با داده های بزرگ بدل گشته که یکی از مهمترین ویژگی های مشترک وب امروزی است، در دسترس بودن و مقیاس پذیری بالایی را برای سیستم های توزیع شده به وجود آورده که نیازمد دسترسی سریع هستند ونمی توانند هیچ تأخیری را در حین شکست ها تحمل بکنند و به طور گسترده در شرکت های بزرگ و کمپانی های وب نظیر فیس بوک، آمازون و گوگل مورد استفاده قرار گرفته است. هر تکنولوژی جدید با چالش های بسیاری نظیر آسیب پذیری امنیتی مواجه می شود. این مقاله به بررسی مفاهیم NoSQL، حرکت، انگیزه و نیازهای پشت آن پرداخته است و انواع پایگاه داده های NoSQL و مسائل مرتبط با این پایگاه داده ها اساساً در حوزه برنامه های کاربردی و مسائل امنیتی در مقایسه با پایگاه داده قدیمی رابطه ای مرور شده است.
1-مقدمه
عنوان مقاله :
نوعی از پایگاهدادههای NoSQL و مقایسه آن با پایگاهداده رابطهای
اطلاعات مقاله :
International Journal of Applied Information Systems (IJAIS) – ISSN : 2249-0868
Foundation of Computer Science FCS, New York, USA
Volume 5– No.4, March 2013 – www.ijais.org
تعداد صفحات ترجمه : 8 صفحه
چکیده انگلیسی :
NOSQL databases (commonly interpreted by developers as „not only SQL databases ‟ and not „no SQL‟) is an emerging alternative to the most widely used relational databases. As the name suggests, it does not completely replace SQL but compliments it in such a way that they can co-exist. In this paper we will be discussing the NOSQL data model, types of NOSQL data stores, characteristics and features of each data store, query languages used in NOSQL, advantages and disadvantages of NOSQL over RDBMS and the future prospects of NOSQL. General terms NOSQL, relational databases, data stores
چکیده
پایگاه داده های NoSQL (معمولا توسط توسعه دهندگان با عنوان "نه تنها پایگاه داده ی SQL" به جای "هیچSQL" تفسیر می شود) در حال حاضر به طور گسترده برای جایگزینی پایگاه داده های رابطه ای استفاده می شوند. همان گونه که نام آن بیان می کند، به طور کامل جایگزین SQL نشده است، اما همان گونه که وجود دارند می توانند تعریف شوند. در این مقاله در مورد مدل داده های NoSQL، انواع ذخیره سازی داده های NoSQL، خصوصیات و ویژگی های هر یک از ذخیره سازی داده، زبان پرس و جوی مورد استفاده در طراحی NoSQL، مزایا و معایب NoSQL نسبت به RDBMS و چشم انداز آینده NoSQL بحث خواهیم کرد.
1-مقدمه
مشکل مدل رابطه ای مسائل مقیاس پذیری، عملکرد درحال تنزل سرعت همانند افزایش حجم داده است. این امر منجر به توسعه یک مدل داده جدید باعنوان NoSQL میشود. بههرحال مفهوم NoSQL مربوط به چند وقت پیش، پس از معرفی پایگاهداده به عنوان سرویس (DBaaS) است که به رسمیت شناخته شده است. بهدلیل مقیاس پذیری بالای NoSQL، بهعنوان یک رقیب بزرگ برای مدل پایگاه داده رابطه ای دیده می شود. برخلاف RDBMS، پایگاهداده های NoSQL برای راحتی در مقیاس پذیری و زمانی که رشد می کنند، طراحی شده اند. اکثر سیستم های NoSQL پشتیبانی چند پلت فرمی و برخی از ویژگی های اضافی و غیر ضروریRDBMS را حذف کرده اند...
جزوه شبکه پیچیده پویا دکتر محمدزاده - دستنویس
عنوان جزوه : جزوه دستنویس دکتر محمدزاده - درس شبکه پیچیده پویا این درس توسط دکتر محمدزاده برای اولین بار در دانشگاه آزاد ملارد تدریس شده است.
در این جزوه چند فصل از کتاب باراباس طی 9 جلسه تدریس شده است. این جروه مختص دانشجویان کارشناسی ارشد کامپیوتر در گرایش نرم افزار می باشد.
عنوان جزوه : جزوه دستنویس دکتر محمدزاده - درس شبکه پیچیده پویا
این درس توسط دکتر محمدزاده برای اولین بار در دانشگاه آزاد ملارد تدریس شده است.
در این جزوه چند فصل از کتاب باراباس طی 9 جلسه تدریس شده است.
این جروه مختص دانشجویان کارشناسی ارشد کامپیوتر در گرایش نرم افزار می باشد.
جهت دریافت کل جزوه در 33 صفحه با شماره زیر تماس حاصل فرمایید
مبلغ 50 هزار تومان
در صورت بروز هر گونه مشکل می توانید با شماره زیر در ارتباط باشید:
مسعودی - 09981639982
عنوان مقاله : مروری بر چندین الگوریتم زمانبندی در رایانش ابری
زبان : فارسی
سال انتشار : 1393 (همایش ملی مهندسی نرم افزار)
تعداد صفحات : 9 صفحه
جناب آقای دکتر فرامرز صافی 1 ، حمیدرضا صدرارحامی 2
استاد دانشکده مهندسی کامپیوتر- دانشگاه آزاد نجف آباد پست الکترونیکی
دانشجوی کارشناسی ارشد مهندسی کامپیوتر -دانشگاه آزاد نجف آباد پست الکترونیکی
چكیده
رايانش ابری شیوه جديدی ازارايه خدمات برای کاربران است، که به عنوان فراهم کننده سرويس به صورت پويا در مقیاسی
بزرگ روی منابع موجود در اينترنت شناخته میشود.هدف اصلی در استفاده از محاسبات ابری،کاهش هزينه های استفاده از
منابع می باشد و منابع محاسباتی در سیستمهای محاسبات ابری، به عنوان ماشین های مجازی ارا ئه میشوند. بنابراين هردرخواستی که ازطرف کاربران به ارايه دهندگان خدمات فرستاده شود بخشی ازمنابع آنها را به خود اختصاص میدهد.
الگوريتمهای زمانبندی نقش بسیار مهمی در محاسبات ابری دارند چراکه هدف زمانبندی اين است تا زمان پاسخ را کاهش
داده و بهره برداری از منبع را بهبود بخشد.برای اين منظور الگوريتمهای زمانبندی مختلفی وجود دارد. ما در اين مقاله به بررسی اهمیت مساله تخصیص منابع و برخی الگوريتم های ارايه شده در اين رابطه و ارتباط آن با مصرف انرژی و هزينه محیط های ابری می پردازيم و در نهايت مزايا ومعايب آنها بررسی می گردد.
واژه
واژه های کلیدی : رايانش ابری ، محاسبات ابری ،الگوريتم زمانبندی ، هزينه محیط های ابر ، تخصیص منابع.
خرید و پرداخت هزینه 2500 تومان
عنوان انگلیسی :
Honey bee behavior inspired load balancing of tasks in cloud computing environmen
مشخصات مقاله : j ourna l ho mepage: www.elsevier.com/locate/asoc - سال 2013
تعداد صفحات انگلیسی : 12 صفحه
عنوان فارسی : تعادل بار وظایف الهام گرفته از رفتار زنبور عسل در محیط محاسبات ابری
تعداد صفحات فارسی = 12 صفحه
چکیده
زمانبندی وظایف در محاسبات ابری یک مساله بهینهسازی NP-سخت است. تعادل بار وظایف مستقل غیرپیشگیرانه در ماشینهای مجازی (VMS) از جنبههای مهم زمانبندی وظیفه در ابر است. هرگاه برخی ماشینهای مجازی سربارگذاری شوند و سایر ماشینهای مجازی با وظایف برای پردازش، کم بارگذاری شده باشند، برای رسیدن به بهرهبرداری بهینه از ماشینها، بار سیستم باید تعدیل شود. در این مقاله، ما یک الگوریتم به نام تعادل بار الهام گرفته از رفتار زنبور عسل (HBB-LB) را پیشنهاد کردهایم که هدف آن دستیابی به تعادل بار در سراسر ماشینهای مجازی برای به رسیدن به حداکثر توان است. الگوریتم پیشنهاد شده وظایف را بر اساس اولویت در ماشینهای مجازی متعادل میکند به گونهای که مدت زمان انتظار وظایف در صف حداقل باشد. ما الگوریتم پیشنهادی را با الگوریتمهای تعادل بار و زمانبندی موجود مقایسه کردهایم. نتایج تجربی نشان می دهد که الگوریتم ما در مقایسه با الگوریتمهای موجود موثر عمل میکند. رویکرد ما نشان میدهد که بهبود قابل توجهی در متوسط زمان اجرا و کاهش زمان انتظار وظایف در صف وجود دارد.
1-مقدمه
محاسبات ابری یک رویکرد مبتنی بر اینترنت که در آن تمام برنامههای کاربردی و فایلها در یک ابر متشکل از هزاران کامپیوتر که به شیوهای پیچیده به هم مرتبط شده اند، میزبانی میشود. محاسبات ابری مفاهیم محاسبات موازی و توزیع شده را به منظور ارائه مبتنی بر تقاضای منابع به اشتراک گذاشته، سخت افزار، نرم افزار و اطلاعات به کامپیوتر و یا دستگاههای دیگر، ترکیب میکند. این پیدایش سیستمهای توزیع شده بر اساس مدل «پرداخت به ازای مصرف» است. مشتری نیاز به خرید نرمافزار یا بستر محاسباتی ندارد. با امکانات اینترنت، مشتری میتواند قدرت محاسباتی و یا منابع نرمافزاری را فقط با پرداخت پول برای مدت زمان استفادهشده از منابع، به کار گیرد. این سیاستهای صدور مجوز نرمافزار را مجبور میکند تا تغییر کرده و از هزینه پول برای امکانات استفاد نشده توسط مشتری در یک بسته نرمافزاری جلوگیری کند...
خرید و پرداخت مبلغ 13 هزار تومان
عنوان انگلیسی : Intelligent Strategy of Task Scheduling in Cloud Computing for Load Balancing
مشخصات مقاله : International Journal of Emerging Trends & Technology in Computer Science (IJETTCS) - سال 2013
چکیده :
Cloud computing is a type of parallel and distributed system consisting of a collection of interconnected and virtual computers. With the increasing demand and benefits of cloud computing infrastructure, different computing can be performed on cloud environment. One of the fundamental issues in this environment is related to task scheduling. Cloud task scheduling is an NP-hard optimization problem, and many meta-heuristic algorithms have been proposed to solve it. A good task scheduler should adapt its scheduling strategy to the changing environment and the types of tasks. In this paper a cloud task scheduling policy based on ant colony optimization algorithm for load balancing compared with different scheduling algorithms has been proposed. Ant Colony Optimization (ACO) is random optimization search approach that will be used for allocating the incoming jobs to the virtual machines. The main contribution of our work is to balance the system load while trying to minimizing the makespan of a given tasks set. The load balancing factor, related to the job finishing rate, is proposed to make the job finishing rate at different resource being similar and the ability of the load balancing will be improved. The proposed scheduling strategy was simulated using Cloudsim toolkit package. Experimental results showed that, MACOLB algorithm decrease the degree of imbalancing between available virtual machines and increase the overall performance.
تعداد صفحات انگلیسی : 11 صفحه
عنوان فارسی :
استراتژی هوشمند زمانبندی وظیفه برای تعادل بار در محاسبات ابری
چکیده
محاسبات ابری نوعی از سیستمهای موازی و توزیع شده شامل مجموعهای از کامپیوترهای به هم متصل و مجازی است. با افزایش تقاضا و مزایای زیرساختهای محاسبات ابری، انواع مختلفی از محاسبات را میتوان در محیط ابر اجرا کرد. یکی از مسائل اساسی در این محیط مرتبط با زمانبندی وظیفه است. زمانبندی وظیفه ابر یک مسئلهی بهینهسازی NP-سخت است، و بسیاری از الگوریتمهای فرااکتشافی برای حل آن پیشنهاد شده است. زمانبند وظیفه خوب باید استراتژی زمانبندی خود را با محیط در حال تغییر و انواع وظایف وفق دهد. در این مقاله یک سیاست زمانبندی وظیفه ابر بر اساس الگوریتم بهینهسازی کلونی مورچهها برای تعادل بار در مقایسه با الگوریتمهای زمانبندیهای مختلف مطرح شده است. الگوریتم مورچگان (ACO) روش جستجو بهینهسازی تصادفی است که برای تخصیص کارهای ورودی به ماشین های مجازی استفاده میشود. سهم اصلی این مقاله، تعادل بار سیستم در حال تلاش برای به حداقل رساندن makespan مجموعه وظایف داده شده است. عامل تعادل بار، مربوط به نرخ اتمام وظایف، برای نرخ اتمام کار در منابع مختلف مشابه و بهبود توانایی حفظ تعادل بار است. استراتژی زمانبندی پیشنهادی با استفاده از بسته ابزار Cloudsim شبیهسازی شده است. نتایج تجربی نشان میدهد که، الگوریتم MACOLB درجه نامتعادلی بین ماشینهای مجازی موجود را کاهش و عملکرد کلی را افزایش میدهد.
1-مقدمه
محاسبات ابری به عنوان یک مدل محاسباتی برای انواع حوزههای برنامههای کاربردی استفاده شده، توجه زیادی به دست آورده است. سرویسهای محاسبات ابری به کاربران اجازه میدهند منابع محاسباتی را در قالب ماشین های مجازی (VMS) از مراکز داده در مقیاس بزرگ توسط ارائه دهندگان سرویسها اجاره کنند [1]. با استفاده از سرویسهای ابر، کاربران ابر میتوانند طیف گستردهای از برنامههای کاربردی را به صورت پویا و بر اساس تقاضا معمولاً از سه جنبه اساسی مورد توجه مستقر کنند: زیرساخت به عنوان یک سرویس (IaaS)، پلت فرم به عنوان سرویس (PaaS) و نرم افزار به عنوان سرویس (SaaS) [2 ]. بیشتر ارائه دهندگان سرویسهای ابر از ماشین مجازی برای ارائه اشتراکگذاری منابع انعطافپذیرتر و مقرون به صرفهتر استفاده میکنند...
خرید و پرداخت مبلغ 14 هزار تومان
عنوان انگلیسی : A high concurrency XPath-based locking protocol for XML databases
Abstract
Providing efficient access to XML documents becomes crucial in XML database systems. More and more concurrency control protocols for XML database systems were proposed in the past few years. Being an important language for addressing data in XML documents, XPath expressions are the basis of several query languages, such as XQurey and XSLT. In this paper, we propose a lock-based concurrency control protocol, called XLP, for transactions accessing XML data by the XPath model. XLP is based on the XPath model and has the features of rich lock modes, low lock conflict and lock conversion. XLP is also proved to ensure conflict serializability. In sum, there are three major contributions in this paper. The proposed XLP supports most XPath axes, rather than simple path expressions only. Conflict conditions and rules in the XPath model are analyzed and derived. Moreover, a lightweighted lock mode, P-lock, is invented and integrated into XLP for better concurrency.
تعداد صفحات انگلیسی : 9 صفحه
عنوان فارسی : پروتکل قفل گذاری بر مبنای XPath، با همزمانی بالا برای پایگاه داده های XML
چکیده:
فراهم ساختن بستری مناسب در جهت دسترسی موثر به اسناد XML، به یک امر بسیار مهم در سیستم های پایگاه داده ی XMLتبدیل شده است. در سال های اخیر، پروتکل های کنترل زیادی برای سیستم های پایگاه داده ی XMLپیشنهاد شده اند. عبارات XPath، که یک زبان مهم برای کار با اسناد XMLمیباشد، اساس و پایه ی زبان های پرس و جوی متعدد، از قبیل XQuery و XSLTرا تشکیل میدهند. در این مقاله، ما یک پروتکل کنترل همزمانی بر مبنای قفل گذاری ، که XLPنام دارد را، برای تراکنش هایی که توسط مدل XPath، به داده های XMLدسترسی دارند، ارائه میدهیم.XLPبر مبنای مدل XPath بودهو دارای ویژگی هایی از قبیل مدهای قفل گذاری غنی،تعارض قفل پایین و تبدیل قفل میباشد. همچنین اثبات شده است که XLPقابلیت تسلسل تعارض را حتمی میکند. به طور خلاصه، سه سهم و همبخشی اساسی در این مقاله وجود دارد. XLP بجایپشتیبانی ازفقط یک عبارت مسیر منفرد، از اغلب محورهای XLPپشتیبانی میکند. شرایط تعارض و قوانین در مدل XPathآنالیز شده و مورد استنتاج قرار گرفته اند. علاوه بر این، یک مد قفل گذاری سبک، تحت نام p-lock، به منظور همزمانی بهتر، طراحی و در داخل XLP ادغام شده است.
تعداد صفحات ترجمه فارسی : 28 صفحه
خرید و پرداخت هزینه 13 هزار تومان
عنوان انگلیسی : Modeling Fuzzy Data with Fuzzy Data Types in Fuzzy Database and XML Modelsn
Abstract: Various fuzzy data models such as fuzzy relational databases, fuzzy object-oriented databases, fuzzy objectrelational databases and fuzzy XML have been proposed in the literature in order to represent and process fuzzy information in databases and XML. But little work has been done in modeling fuzzy data types. Actually in the fuzzy data models, each fuzzy value is associated with a fuzzy data type. Explicit representations of fuzzy data types are the foundation of fuzzy data processing. To fill this gap, in this paper, we propose several fuzzy data types, including fuzzy simple data types, fuzzy collection data types and fuzzy defined data types. We further investigate how to declare the fuzzy data types in the fuzzy object-oriented database model and fuzzy XML Schema. The proposed fuzzy data types can meet the requirement of modeling
fuzzy data in the fuzzy databases and fuzzy XML.
Keywords: Database models, fuzzy data, fuzzy data types, fuzzy databases, fuzzy XML, modeling. Received December 7, 2011; accepted May 22, 2012; published online August 5, 2012
تعداد صفحات انگلیسی : 6 صفحه
عنوان فارسی :
مدل سازی داده های فازی با انواع داده های فازی در پایگاه داده فازی و مدل های XML
چکیده
مدل های مختلف داده های فازی مانند پایگاه داده های رابطه ای فازی ، پایگاه داده شی گرا فازی، پایگاه داده های مبتنی بر رابطه بین اشیا فازی و XML فازی به منظور نشان دادن و پردازش اطلاعات فازی در پایگاه داده ها و XML در ادبیات ارائه شده است. اما کاراندکی برای مدل سازی انواع داده های فازی انجام شده است. در واقع در مدل داده های فازی، هر مقدار فازی با یک نوع داده فازی در ارتباط است. بازنمایی صریح از انواع داده های فازی پایه و اساس پردازش داده های فازی است. برای پر کردن این شکاف، در این مقاله، ما انواع مختلف داده های فازی را از جمله انواع داده های فازی ساده ، انواع داده های مجموعه های فازی و انواع داده تعریف شده فازی ارائه می دهیم. ما نحوه بیان انواع داده های فازی را در مدل پایگاه داده شی گرا فازی و طرحواره XML فازی بیشتر بررسی می کنیم. انواع داده های فازی پیشنهادی می توانند به الزامات مدل سازی داده های فازی در پایگاه داده های فازی و XML فازی دست یابند.
کلمات کلیدی: مدل های پایگاه داده، داده های فازی، انواع داده های فازی، پایگاه داده های فازی، XML فازی، مدل سازی.
تعداد صفحات ترجمه فارسی : 14 صفحه
خرید و پرداخت مبلغ 10 هزار تومان
عنوان انگلیسی : Parallel Processing of large graphs
More and more large data collections are gathered worldwide in various IT systems. Many of them possess a networked nature and need to be processed and analysed as graph structures. Due to their size they very often require the usage of a parallel paradigm for efficient computation. Three parallel techniques have been compared in the paper: MapReduce, its map-side join extension and Bulk Synchronous Parallel (BSP). They are implemented for two different graph problems: calculation of single source shortest paths (SSSP) and collective classification of graph nodes by means of relational influence propagation (RIP). The methods and algorithms are applied to several network datasets differing in size and structural profile, originating from three domains: telecommunication, multimedia and microblog. The results revealed that iterative graph processing with the BSP implementation always and significantly, even up to 10 times outperforms MapReduce, especially for algorithms with many iterations and sparse communication. The extension of MapReduce based on map-side join is usually characterized by better efficiency compared to its origin, although not as much as BSP. Nevertheless, MapReduce still remains a good alternative for enormous networks, whose data structures do not fit in local memories
چکیده
امروزه مجموعه دادههای بزرگ و بزرگتری در سیستمهای IT مختلف سرتاسرجهان جمع آوری میشود. بسیاری از آنها، یک ذات شبکه بندی شدی را پردازش کرده و نیاز به پردازش و تحلیل به عنوان ساختارهای گراف دارند. به دلیل اندازه آنها، اغلب استفاده از طرجی موازی برای محاسبه کارآمد مورد نیاز است. سه تکنیک موازی سازی در این مقاله مقایسه شدهاند:MapReduce، گسترش آن در اتصال سمت نگاشت و موازی سازی همگام انبوه (BSP). این تکنیکها برای دومسئله گراف مختلف پیاده سازی شدهاند: محاسبه کوتاهترین مسیرها از یک مبدا (SSSP) و دسته بندی انبوه گرههای گراف با استفاده از انتشار تاثیر نسبی (RIP). روشها و الگوریتمها به دادههای شبکه متعددی با اندازه و پروفایل ساختاری مختلف اعمال شدهاند که از سه دامنه نشأت میگیرند: ارتباط راه دور، رسانه و میکرووبلاگ. نتایج نشان دادهاند که پردازش تکرارشونده گراف با پیاده سازی BSP همیشه و به طور قابل توجهی حتی تا 10 برابر و به خصوص برای الگوریتمهایی با تکرار زیاد و ارتباطات تنک، بهتر ازMapReduce است. گسترش MapReduce برپایه اتصال سمت نگاشت معمولا کارآیی بهتری در مقایسه با الگوریتم اصلی دارد، اگرچه بهاندازه BSP نمیباشد. با این حال، MapReduce همچنان برای شبکههای حجیم که ساختارداده آنها در حافظه محلی جای نمیگیرد، جایگزینی مناسب است.
1-مقدمه
بسیاری از مسائل علمیو تکنیکی به داده ای با ذات شبکه مرتبط اند که میتواند نسبتا به سادگی با استفاده از گراف نمایش داده شود. گرافها، انتزاعی انعطاف پذیر برای توصیف روابط بین اشیاء گسسته فراهم میکنند. بسیاری از مسائل عملی را میتوان در محاسبات علمی، تحلیل داده و دیگر شاخهها به شکل مورد نیاز با گراف مدلسازی کرده و توسط الگوریتمهای گراف مناسب حل کرد.
در بسیاری از محیطها، ساختارهای گراف آنقدر بزرگ اند که نیاز به روشهای پردازش خاصی، به خصوص به طور موازی دارند. این مسئله به خصوص برای مجموعه دادههای کاربران که ردپای خود را در سرویسهای روی خط و ارتباطی مختلفی جای میگذارند، از جمله پورتالهای انتشار رسانه یا سایتهای شبکههای اجتماعی، یوتوب و فیسبوک، حیاتی است. به علاوه این پایگاههای داده، رفتار مختلف کاربر را نشان میدهند که نمایش گراف آنها ممکن پیچیده و همراه با چندین خط ارتباطی بین گرههای شبکه باشد. این مسئله نیاز به روشهای تحلیلی دارد که نه تنها با گرافهای ساده بلکه با گرافهای چندگانه و فراگرافها دست وپنجه نرم کنند...
تعداد صفحات ترجمه فارسی : 40 صفحه