توقع تحليلات البيانات الضخمة (BDA) على وسائل التواصل الاجتماعي: دراسة تجريبية

عاهد جمعة الخطيب
باحث علمي في الطب والفلسفة وعلم الاجتماع
(Ahed Jumah Khatib)

الحوار المتمدن-العدد: 7170 - 2022 / 2 / 22 - 08:17
المحور: الفلسفة ,علم النفس , وعلم الاجتماع

الملخص:
في الوقت الحالي ، تتجه معظم الدراسات نحو تحليلات البيانات الضخمة (BDA) لأنها مهمة في البحث ، وقد أصبح هذا مهمًا بشكل متزايد حيث أصبحت تقنيات الإنترنت والويب 2.0 شائعة بشكل متزايد وكيفية التعامل مع هذه البيانات الضخمة. علاوة على ذلك ، أحدث انتشار الإنترنت ووسائل التواصل الاجتماعي ثورة في عملية البحث. مع هذه البيانات الضخمة من البيانات التي تم إنشاؤها بواسطة المستخدمين باستخدام وسائل التواصل الاجتماعي أو المنصات الإلكترونية ، يتم دمج استخدام هذه التفاصيل والأنشطة اليومية مع الأدوات
المصممة للتحليل. ستتم مناقشة موضوع تحليل وسائل التواصل الاجتماعي الكبيرة وسيتم تقديم شرح مكثف لموضوع البيانات الضخمة. تقارن هذه الورقة بين تقنيات تحليل البيانات الضخمة باستخدام عدة طرق للتحليل ، أول تقنية تستخدم الشبكات العصبية والتقنية الثانية باستخدام تجميع البيانات. الغرض من هذه الدراسة هو استنتاج الأعمار التي تستخدم وسائل التواصل الاجتماعي وما هي اهتماماتهم في الكتابة وفي النهاية ، من هم الذكور أو الإناث الأكثر استخدامًا على وسائل التواصل الاجتماعي.
المقدمة:
أدت شعبية الإنترنت إلى وجود تقنيات Web 2.0 ، مما أتاح لنا الوصول إلى جميع مشاهدات الموضوعات الخاصة بـ Web 2.0 ، ووسائل التواصل الاجتماعي ، وأي منصة إلكترونية في العالم عبر الإنترنت. علاوة على ذلك ، أدى انتشار وسائل التواصل الاجتماعي واعتمادها وموثوقيتها إلى خلق نماذج من الفرص والتحديات بالنسبة لـبيانات الباحث. على الصعيد العالمي ، يستخدم أكثر من مليار شخص منصات التواصل الاجتماعي التي تولد البيانات على أساس يومي وتشكلها لبيانات على فترات قصيرة. إن الكم الهائل من البيانات التي يتم إنشاؤها بواسطة المستخدمين بشكل دوري هو نتيجة لتكامل تفاصيل الواجهة الخلفية والأنشطة اليومية. في هذه الورقة. سيتم شرح هذه الكمية الهائلة من البيانات التي تم إنشاؤها ، والتي يشار إليها باسم "البيانات الضخمة" ، مؤخرًا. يتم جمع البيانات في شكل مجموعات ويتم جمع هذه البيانات الضخمة يمكن أن تكون منظمة أو شبه منظمة أو غير منظمة في مختلف المجالات. مثل الشبكات الاجتماعية والرعاية الصحية [1]. كل يوم ، يتم عرض عدد كبير من وسائل التواصل الاجتماعي ، مما يفتح مجالًا للذكاء الاصطناعي وتحليل البيانات. هو حاليا تحليل بيانات الوسائط الاجتماعية باستخدام التعلم الآلي واستخراج البيانات. إنه أحد أهم المجالات. إنه مجال بحث نشط. يتضمن محتويات وسائل التواصل الاجتماعي مثل التعليقات ،
المنشورات والمدونات والمراجع ، التي ساهمت في إنشاء البيانات الضخمة على مجموعة واسعة من مواقع الويب المختلفة أو مزودي الأنظمة. أساسي [2 ، 3] على سبيل المثال ، الإفصاح عن المعلومات لنظام معين يمكن أن يأخذ آراء الناس وهذه الآراء تؤدي إلى تحسين عمليات صنع القرار. تتناول هذه الدراسة العمل الذي تم تحليله في عمليات الشبكة العصبية الكبيرة باستخدام أساليب التعلم الآلي. في هذه الدراسة ، نقوم بتحليل بيانات وسائل التواصل الاجتماعي ، بما في ذلك الأعمار المستهدفة في عملية التحليل أو الأعمار التي تستخدم وسائل التواصل الاجتماعي بشكل متكرر أو بشكل يومي. ثانيًا ، حددنا أعلى نسبة من الأشخاص الذين يستخدمون وسائل التواصل الاجتماعي وسائل الإعلام ، سواء كانوا ذكورًا أو إناثًا.
ثانيًا. مراجعة الأدبيات
العوامل السلوكية أو التغييرات التي تحدث على المحتوى قبل النشر وبعده وكيفية تفاعل هذا المحتوى من خلال مراقبة وتحليل جميع الأنشطة الفردية عبر Facebook ، تستخدم آليتها تحليل الفروق في الاختلافات (DID) [4]. كيفية جمع المعلومات من وسائل التواصل الاجتماعي وعمل مسح للاستعلام عنها هذه البيانات في مقابل نتيجة هذا الفحص أو الاستعلام سيؤدي إلى توسع في عالم ويكيبيديا وأهم عامل في البيانات هو الترتيب الزمني للعلاقات الاجتماعية. يتم استخدام آليتها للإحصاء الزمني [5]. كيفية التعامل مع كمية البيانات الاجتماعية المتاحة عبر الإنترنت. لتحليل هذه البيانات ، اعتاد Hadoop و Spark على
تحليل البيانات الضخمة ، بالإضافة إلى الخوارزمية المقترحة لتقليل تكاليف معالجة البيانات ، تستخدم آليتها تحليل الأداء [6]. حل أو خوارزمية لتحليل البيانات الضخمة باستخدام خوارزمية حجز داخل النموذج تتبع الكلمات الرئيسية للتحليل. تستخدم آليتها الكشف عن الأحداث وتحليلها [7]. مقدمة حول نصائح لاستخدام التطبيقات الاجتماعية التي يمكن استخدامها ، مثل ويكيبيديا ويوتيوب وفيسبوك وسكند لايف للاستفادة من هذه البيانات ودعم القرار. [8]. كيف يتواصل الناس مع بعضهم البعض ويجب أن يوفروا منصات للتواصل فيما بينهم ويجب عليهم تشجيع العملاء على المشاركة في هذه المنصات [9]. تم استخدام ستة أنواع من أنماط التدفق للفيديو لصور ثنائية الأبعاد. تُستخدم هذه الميزة لمعالجة الصور [13].
تؤكد النتائج أن أداء آلة متجه الدعم وخوارزميات المنطق الضبابي ذات الميزات الأقل تقدم دقة أفضل من خوارزميات التعلم الآلي الأخرى. هذه أيضًا أقل كثافة من الناحية الحسابية من التقنيتين الحاليتين الأخريين [13].
أ. الشبكات العصبية الاصطناعية
الشبكة العصبية الاصطناعية (ANN) هي عرض حسابي يسعى إلى تمثيل الفكرة الموازية للعقل البشري. An (ANN) هو نظام من مكونات معالجة شديدة الترابط (الخلايا العصبية) تعمل بالتوازي. يتم تحفيز هذه المكونات بواسطة الأنظمة الحسية العضوية. كما هو الحال في الطبيعة ، فإن الارتباطات بين المكونات تحدد إلى حد كبير عمل النظام.

تعتمد هذه الخوارزمية على معالجة الصور وتحسين المرشحات للحفاظ على معالجة الصورة. باستخدام هيكل منخفض المستوى. [14]. تعتمد العلاقات الاجتماعية على المستخدمين المختلفين للشبكات الاجتماعية لإيجاد رابط بين نظرية الشبكة والتواصل. [15] يعتبر مفهوم الشبكات العصبية العميقة (DNNs) من أهم العلوم الحديثة التي تركز على تحديد وظائف التعرف على الأنماط مثل الصور أو حل الخوارزميات [10]. الشبكات العصبية الاصطناعية مستوحاة من نمذجة الدماغ التي تسمى الخلايا العصبية أو الإدراك الحسي ، وهي عبارة عن نفايات سائلة ناتجة عن تنشيط حالتها الداخلية المستلمة من المدخلات [11]. يتم تقديم المعاملات المالية ويتم جمع بيانات وسائل التواصل الاجتماعي لحساب درجة الائتمان. تُستخدم الشبكات العصبية الاصطناعية للحصول على فهم عام لها [12].
ثالثا. أسئلة البحث وأهداف البحث ومنهجيته
أ. أسئلة البحث
تحاول هذه المقالة تحديد مجموعة من الأسئلة التي يجب الإجابة عليها بشكل صريح وواضح. تتم الإجابة على هذه الأسئلة بناءً على البيانات الضخمة ويتم تحليلها باستخدام عدة طرق. أخيرًا ، يتم الرد على هذه الأسئلة.
س 1: ما هي الأعمار التي تستخدم فيها وسائل التواصل الاجتماعي؟ في هذا السؤال ، سنلقي نظرة على الأعمار الأكثر استخدامًا لوسائل التواصل الاجتماعي.
س 2: من هم الأشخاص الأكثر استخدامًا لوسائل التواصل الاجتماعي ، ذكورًا أم إناثًا؟ في هذا السؤال ، سننظر في من هم أكثر وسائل التواصل الاجتماعي استخدامًا ، ذكورًا أم أنثى.
س 3: ما هي اهتمامات الناس في الكتابة؟ في هذا السؤال ، سننظر في اهتمام الناس وهوايتهم في الكتابة.
أهداف البحث
الشبكة العصبية هي نظام من الأجهزة أو البرامج التي تم تصميمها على غرار تلك الموجودة في الخلايا العصبية في الدماغ البشري. تسمى الشبكات العصبية أيضًا الشبكات العصبية الاصطناعية (ANNs). علاوة على ذلك ، يحتوي الذكاء الاصطناعي (AI) على قسم يتضمن التعلم العميق. في هذه الورقة البحثية ، تم استخدام بيانات المشروع ، والتي تسمى الشبكة الاجتماعية ،
وتم إجراء عملية التحليل باستخدام أجهزة الشبكة العصبية. يحتوي التحليل على البيانات التالية مثل الرقم ،
الاسم والعمر والمصدر والمتابعون والاهتمامات وموقع Twitter.
منهجية البحث
منهجية البحث المقترحة المستخدمة في هذه الدراسة على النحو التالي:
الخطوة 1: حدد تطبيقات مشروع التطوير الجديدة. مشروع ISBSG. وبشكل أكثر تحديدا ، طريقة Excel.
الخطوة 2: حدد السمات.
الخطوة 3: تصفية البيانات من خلال Excel.
الخطوة 4: قسّم البيانات إلى قسمين ، Facebook و Twitter وسيختار كل منهما سمات محددة للإجابة على
ثلاثة أسئلة في هذا البحث.
الخطوة 5: تحليل البيانات على أساس تجميع البيانات.
الخطوة 6: تحليل البيانات بناءً على نموذج الشبكة العصبية.
الخطوة 7: عرض نتائج البحث والمناقشات. يوضح الشكل 2 منهجية البحث التفصيلية التي تم القيام بها لتحقيق أهداف البحث على النحو التالي:
لقراءة البيانات من برنامج Excel ، حدد الميزات المطلوبة ، مع مشاريع التصفية ، ويمكن تقسيمها إلى مشاريع تطوير أو ترويج ، ثم الكشف عن البرامج المتطرفة بناءً على ميزات مختارة سيتم استخدام التقنيات ، في النهاية ، الحصول على النتائج ، على سبيل المثال ، تحليل البيانات على أساس تجميع البيانات والشبكات العصبية.

رابعا. النتائج التجريبية
أ. المتغير المستقل
يوضح الجدول 1 التالي المتغيرات المستخدمة في تحليل البيانات بشكل أوضح. هذه المتغيرات تعتمد بشكل رئيسي على عملية التحليل وهي ذات أهمية كبيرة. يوضح الجدول التالي ملف
المتغيرات المستخدمة:

يوضح الجدول 2 التالي جميع المتغيرات المستخدمة في تحليل البيانات وسيتم شرحها بالتفصيل. تعتمد هذه المتغيرات بشكل أساسي على عملية التحليل ولها أهمية كبيرة.

التقنيات
ترتبط تقنيات تحليل البيانات الضخمة في سياق الوسائط الاجتماعية بالشبكات العصبية وتجميع البيانات. يقدم هذا القسم تقنيات مهمة لتحليلات البيانات الضخمة فيما يتعلق بتحليل بيانات وسائل التواصل الاجتماعي.
ج. تحليل النتائج باستخدام الشبكة العصبية
يجب تحليل البيانات لتحديد من يستخدم Facebook و Twitter وما هي اهتماماتهم الكتابية ، وهي الأعمار المستهدفة في هذه الدراسة ، يجب أن نذكر اسم مجموعة البيانات المستخدمة هو شبكة اجتماعية ، وعملية التحليل باستخدام الخوارزمية متعددة الطبقات.
4.C.1) تحليل بيانات الأشخاص الذين يستخدمون Facebook
في هذا القسم ، نحتاج إلى تحليل بيانات الأشخاص الذين يستخدمون Facebook واهتماماتهم المكتوبة والأعمار المستهدفة ، وعملية التحليل باستخدام خوارزمية متعددة الطبقات.

في الجدول 3 السابق ، يقدم لنا ملخصًا كاملاً للعينات والحالات المأخوذة من شبكة البيانات الاجتماعية (Facebook) التي أجريت على إجمالي العمليات: يمكن تتبع التدريب والاختبار والنتائج بالنسب المئوية.

Table 4: Network information
في الجدول السابق 4 ، يقدم لنا ملخصًا كاملاً لمعلومات الشبكة (Facebook). في هذا الجدول نلخص العملية المستخدمة وهي المدخلات وعملية المعالجة والمخرجات. في المرحلة الأولى من الإدخال ، تستخدم سمات العمر والرسائل والأصدقاء وما إلى ذلك. في المرحلة الثانية ، تقسم المرحلة البيانات إلى طبقات وتنقسم إلى 8 طبقات. في المرحلة الأخيرة تسمى هذه المرحلة الإخراج وتعتمد هذه المرحلة على العامل الرئيسي في التصنيف هو الجنس (ذكر أو أنثى).

في الجدول 5 السابق ، يقدم لنا ملخصًا كاملاً لمعلومات الشبكة (Facebook). تنقسم هذه المرحلة إلى قسمين هما أول تدريب في هذا القسم له عدة عمليات منها النسبة المئوية للتنبؤات الخاطئة وعامل الوقت في مرحلة التقسيم ، إلخ. في القسم الثاني يتم عرض نسبة الخطأ في الاختبارات ونسبة التنبؤ ، المتغيرات التابعة الجنس. في الشكل 5 ، يقدم لنا ملخصًا كاملاً لمعلومات الشبكة (Facebook). في هذا الجدول ، نلخص العملية المستخدمة ، أي المدخلات والعملية والمخرجات. ومع ذلك ، في هذه المرحلة ، تم تحويل النص إلى تصور لسهولة فهم البيانات وهو دائمًا أفضل طريقة لتمثيل البيانات. في الجدول أدناه ، سيتم تلخيص هذه الصور ليتم توضيحها عن طريق كتابة جميع البيانات في جدول.

في الجدول 6 السابق ، تم اشتقاق هذه البيانات من الشكل 5. جميع الأعمار التي تستخدم Facebook مستمدة من مجموعة البيانات المأخوذة وما يثير اهتمام الأشخاص في الكتابة ، تم استخدام 8 طبقات مخفية للروابط والاهتمامات ، وما إذا كان الشخص الذي يستخدم Facebook ذكرًا أم أنثى.

في الجدول 7 السابق ، تم استخدام طريقتين للتصنيف: التدريب والاختبار. في كلتا الحالتين ، عينات من الذكور والإناث تم أخذ العينات ، وبناءً على هذه العينات ، تم أخذ العينات بنسب مئوية. يعتمد هذا الجدول على المتغير التابع الجنس.

في الشكل 4 السابق ، أخذنا محوري x و y. يتم تعريف المحور x على أنه المتغير الذي يسمى المحور y والمحور y لمتغير المصدر (Facebook). بناءً على هذين المتغيرين ، تم تحديد الفئة الأكثر استخدامًا في Facebook على أنها ذكر أم أنثى. الجواب ذكر من المعطيات الموجودة ، واللون (الأحمر) يدل على الذكر بالرسم.

في الجدول 8 السابق يعتبر من أهم الجداول لأنه يوضح أهم المتغيرات وما هو العامل الأكثر أهمية. اعتمادًا على جدول الاستجابة ، يعد عدد إعادة الرد هو العامل الأكثر أهمية بين جميع العوامل.

في الشكل 5 السابق ، أحد أهم المخططات لأنه يشرح أهم المتغيرات وما هو العامل الأكثر أهمية؟ اعتمادًا على الرسم التخطيطي ، يتم شرح المعلومات أو العوامل بشكل أوضح من الجداول. يعد عدد إعادة الرد هو العامل الأكثر أهمية بين جميع العوامل.

في الشكل 6 السابق ، كان توزيع الجنس (ذكر ، أنثى) مبينًا بالنسب المئوية. وبلغت نسبة الذكور 70.65٪ والإناث 29.35٪.

في الشكل 7 السابق ، تم تحديد توزيع العمر والاسم بالنسب المئوية. يتم توزيع البيانات اعتمادًا على أكبر فئة من الاسم والعمر والنسب المئوية المعطاة.

في الشكل 8 السابق ، يتم تحديد توزيع الرسائل والعمر بالنسب المئوية. يتم توزيع البيانات بناءً على أكبر فئة من الرسائل (هجوم ، وسائط ، سياسة ، شخصية ، إلخ) وعمر الأشخاص الذين يستخدمون Facebook.

في الشكل 9 السابق ، تستخدم هذه الصورة عددًا من العوامل التي تم تبنيها للعثور على توضيح للأشخاص الذين يستخدمون وسائل التواصل الاجتماعي منصة التواصل (Facebook) ، ومن خلال الصورة يظهر أن عدد الذكور أكثر استخدامًا من عدد الإناث ، كما توضح اهتمامات الناس في التعبير عن آرائهم عبر Facebook.

في الشكل 10 السابق ، توضح الصورة بالتفصيل الأعمار التي تستخدم Facebook وهي مقسمة إلى قسمين: الأول ، الذكور ، وما هي الأعمار الأكثر استخدامًا للفيس بوك ، والثاني للإناث الأكثر استخدامًا على Facebook. تم استخدام عوامل أخرى ، مثل الاسم والاهتمامات ، وتم توزيع النسب كما هو موضح. 4.C.2) تحليل البيانات عن الأشخاص الذين يستخدمون Facebook k-mean clustering يهدف إلى تقسيم n الملاحظات إلى مجموعات k حيث تنتمي كل ملاحظة إلى الكتلة بأقرب متوسط ، والتي تعمل كنموذج أولي للمجموعة. ينتج عن هذا تقسيم مساحة البيانات إلى خلايا. في هذا القسم ، يجب تحليل البيانات باستخدام طريقة أخرى وهي تحليل مجموعة K-Means.

في الجدول 9 السابق ، في هذا الجدول ، يتم أخذ العينة من كل عامل بشكل أكثر دقة (مع أخذ القيم لكل عامل). يعتبر هذا الجدول هو الأول من حيث أخذ القيم تم إجراؤه على خمسة معلومات مجمعة وإنشاء ما يسمى بالنموذج الأولي. أحد هذه العوامل هو العمر ، وعدد الردود ، والأصدقاء ، وما إلى ذلك.

تحليل البيانات الخاصة بالأشخاص الذين يستخدمون تويتر
في هذا القسم ، نحتاج إلى تحليل بيانات الأشخاص الذين يستخدمون Twitter واهتماماتهم المكتوبة والأعمار المستهدفة ، وعملية التحليل باستخدام خوارزمية متعددة الطبقات.

في الجدول 12 السابق ، ملخص كامل للعينات والحالة المأخوذة من شبكة البيانات الاجتماعية (Twitter) التي أجريت على إجمالي العمليات: يمكن تتبع التدريب والاختبار والنتائج بالنسب المئوية.

في الجدول 13 السابق ، ملخص كامل لمعلومات الشبكة (Twitter). في هذا الجدول نلخص العملية المستخدمة وهي المدخلات وعملية المعالجة والمخرجات. في المرحلة الأولى. من المدخلات ، يمكنك استخدام سمات العمر والرسائل والمتابعين وما إلى ذلك. في المرحلة الثانية ، تقسم هذه المرحلة البيانات إلى طبقات وتنقسم إلى 8 طبقات. في المرحلة الأخيرة تسمى هذه المرحلة الإخراج وتعتمد هذه المرحلة على العامل الأساسي في التصنيف وهو الجنس (ذكر أو أنثى).

في الجدول السابق 14 يقدم لنا ملخصًا كاملاً لمعلومات الشبكة (تويتر). في هذه المرحلة ينقسم التدريب الأول في هذا القسم إلى قسمين له عدة عمليات منها النسبة المئوية للتنبؤات غير الصحيحة وعامل الوقت في مرحلة التقسيم ، إلخ. في القسم الثاني ، توجد النسبة المئوية لاختبارات الخطأ والنسبة المئوية للتنبؤ ، والمتغير التابع هو الجنس. المتغير التابع هو الجنس.

في الشكل 11 السابق ، يوجد ملخص كامل لمعلومات الشبكة (Twitter). في هذا الشكل نلخص العملية المستخدمة ، أي المدخلات والعملية والمخرجات. ومع ذلك ، في هذه المرحلة ، تم تحويل النص إلى تصور لسهولة فهم البيانات وهو دائمًا أفضل طريقة لتمثيل البيانات. في الجدول أدناه ، يتم تلخيص هذه الصور ليتم توضيحها عن طريق كتابة جميع البيانات في جدول.

في الجدول 15 السابق ، تم اشتقاق هذه البيانات من الشكل 11. تم اشتقاق جميع الأعمار التي تستخدم تويتر من مجموعة البيانات المأخوذة وما يثير اهتمام الأشخاص في الكتابة. تم استخدام 8 طبقات مخفية لربط الأعمار والاهتمامات ، وما إذا كان الشخص الذي يستخدم Twitter كذلك ذكر أم أنثى.

في الجدول السابق 16 ، تم اشتقاق هذه البيانات من الشكل 11. جميع الأعمار التي تستخدم تويتر مستمدة من مجموعة البيانات المأخوذة وما يثير اهتمام الأشخاص في الكتابة. تم استخدام 8 طبقات مخفية لربط الأعمار والاهتمامات ، وما إذا كان الشخص الذي يستخدم تويتر ذكرًا أم أنثى.

في الشكل 12 السابق ، أخذنا محوري x و y. يتم تعريف المحور x على أنه المتغير الذي يسمى المحور y والمحور y لمتغير المصدر (twitter). بناءً على هذين المتغيرين ، تم تحديد الفئة الأكثر استخدامًا في Twitter على أنها ذكر أو أنثى. الجواب ذكر من المعطيات الموجودة ، واللون (الأحمر) يدل على الذكر بالرسم.

في الجدول 17 السابق يعد من أهم الجداول لأنه يوضح أهم المتغيرات وما هو أهم عامل. اعتمادًا على الجدول ، تعد الرسالة أهم عامل من بين جميع العوامل.

في الشكل 13 السابق هل من اهم المخططات لانه يشرح اهم المتغيرات وما هو العامل الاهم؟ اعتمادًا على الرسم التخطيطي ، يتم شرح المعلومات أو العوامل بشكل أوضح من الجداول. الرسالة هي أهم عامل بين جميع العوامل.

في الشكل 14 السابق ، كان توزيع الجنس (ذكر ، أنثى) مبينًا بالنسب المئوية. ونسب الذكور 72.61% والإناث 27.39%.

في الشكل 15 السابق ، تم تحديد توزيع العمر والاسم بالنسب المئوية. يتم توزيع البيانات اعتمادًا على أكبر فئة من الاسم والعمر والنسب المئوية المعطاة.

في الشكل 16 السابق ، يتم تحديد توزيع الرسائل والعمر بالنسب المئوية. يتم توزيع البيانات بناءً على أكبر فئة من الرسائل (هجوم ، وسائط ، سياسة ، شخصية ، إلخ) وعمر الأشخاص الذين يستخدمون Twitter.

في الشكل 17 السابق ، في هذه الصورة ، تم اعتماد عدد من العوامل لإيجاد توضيح للأشخاص الذين يستخدمون منصة التواصل الاجتماعي (Twitter) ، ومن خلال الصورة يظهر أن عدد الذكور أكثر استخداماً من الرقم. من الإناث ، كما يشرح اهتمامات الناس في التعبير عن آرائهم عبر تويتر.

في الشكل 19 السابق ، توضح الصورة بالتفصيل الأعمار التي تستخدم تويتر وهي مقسمة إلى قسمين: الأول ، الذكور ، وما هي الأعمار الأكثر استخدامًا للتويتر ، والثاني الأكثر استخدامًا.
إناث للتويتر. تم استخدام عوامل أخرى ، مثل الاسم والاهتمامات ، وتم توزيع النسب كما هو موضح.
4.C.4) تحليل البيانات الخاصة بالأشخاص الذين يستخدمون تويتر
في هذا القسم ، يجب تحليل البيانات باستخدام طريقة أخرى ، وهي تحليل مجموعة K-Means:

في الجدول 18 السابق ، في هذا الجدول ، يتم أخذ العينة من كل عامل بشكل أكثر دقة (مع أخذ القيم لكل عامل). يعتبر هذا الجدول هو الأول من حيث أخذ القيم. تم إجراء خمسة معلومات مجمعة وإنشاء ما يسمى بالنموذج الأولي. العوامل الأخرى هي العمر وعدد التغريدات والمتابعين وما إلى ذلك.

خاتمة
تطورت المعلومات الهائلة حول الحياة على الإنترنت جنبًا إلى جنب مع تقدم أدوات الكمبيوتر كطريقة للتجارب النقدية في السلوك البشري. لقد تم رفعه باستمرار من قبل الشركات والأفراد والحكومات. ناقشت الورقة العديد من الأساسيات من خلال تحليل البيانات الضخمة. تم تقسيم هذه الورقة إلى قسمين من حيث وسائل التواصل الاجتماعي إلى Facebook و Twitter ووجد أن الفئة العمرية تعتمد على البيانات المستخدمة من العشرينيات إلى الثلاثينيات. ثانيًا ، تم تقسيم الأشخاص إلى قسمين من حيث الاتصال ، فالبريد إلى Facebook و Twitter وقد تم الوصول إلى الأشخاص الأكثر استخدامًا للتواصل الاجتماعي بناءً على البيانات المستخدمة كما تم تقسيم الذكور. ثلث الأشخاص إلى قسمين من حيث وسائل التواصل الاجتماعي إلى فيسبوك وتويتر كان للوصول إلى معظم هموم الأشخاص المحصورين بالهجوم ، والشخصية ، والدعم ، والدوائر الانتخابية ، والسياسة ، والإعلام ، والمعلومات ، والتعبئة ، وغيرها. أخيرًا ، نرى الصعوبات البحث المفتوح في اختبار البيانات الضخمة لأنه يعتمد على نوع البيانات وكيفية تحليلها.
المراجع:
[1] Hashem, I. A. T., Yaqoob, I., Anuar, N. B., Mokhtar, S., Gani, A., Khan, S. U. The rise of “Big Data” on cloud computing: Review and open research issues. Information systems 2015, 47, 98-115.
[2] Kwon, O., Lee, N., & Shin, B. Data quality management, data usage experience and acquisition intention of Big Data analytics. International Journal of Information Management, 2014 34(3), 387-394.
[3] Lyu, K., & Kim, H. Sentiment analysis using word polarity of social media. Wireless Personal Communications, 2016 89(3), 941-958.
[4] Grinberg, N., Dow, P. A., Adamic, L. A., Naaman, M.. “Changes in engagement before and after posting to facebook”. Paper presented at the Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems.
[5] Do, N., Rahayu, W., Torabi, T. A query expansion approach for social media data extraction. International Journal of Web and Grid Services, 2016 12(4), 418-441.
[6] Santos, M. C., Meira, W., Guedes, D., Almeida, V. F. (2016). “Faster: a low overhead framework for massive data analysis.” Paper presented at the Cluster, Cloud and Grid Computing (CCGrid), 2016 16th IEEE/ACM International Symposium on.
[7] Li, J., Rao, Y., Jin, F., Chen, H., Xiang, X. “Multi-label maximum entropy model for social emotion classification over short text.” Neurocomputing, 2016 210, 247-256.
[8] Kaplan, Andreas M., Michael Haenlein. “Users of the world, unite! The challenges and opportunities of Social Media”. Business horizons, 2010 53 (1), 59-68.
[9] Mangold, W. Glynn, and David J. Faulds. “Social media: The new hybrid element of the promotion mix”. Business horizons, 2009 52 (4): 357-365.
[10] Nguyen, Anh, Jason Yosinski, and Jeff Clune. “Deep neural networks are easily fooled: High confidence predictions for unrecognizable images”. In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 427-436. 2015.
[11] Fulcher, J. “Computational intelligence: an introduction Computational intelligence: a compendium” (pp. 3-78): Springer, 2008.
[12] Ghiassi, M., Zimbra, D., Lee, S. “Targeted twitter sentiment analysis for brands using supervised feature engineering and the dynamic architecture for artificial neural networks.” Journal of Management Information Systems, 2016 33(4), 1034-1058.
[13] Shanthi, C., Pappa, N. “An artificial intelligence based improved classification of two-phase flow patterns with feature extracted from acquired images.” ISA transactions, 2017 68, 425-432.
[14] Fan, Z., Bi, D., He, L., Shiping, M., Gao, S., Li, C. “Low-level structure feature extraction for image processing via stacked sparse denoising autoencoder.” Neurocomputing, 2017 243, 12-20.
[15] Serrat, O. “Social network analysis Knowledge solutions” (pp. 39-43): Springer, 2017

#عاهد_جمعة_الخطيب (هاشتاغ) Ahed_Jumah_Khatib#

اشترك في قناة ‫«الحوار المتمدن» على اليوتيوب
حوار مع الكاتبة انتصار الميالي حول تعديل قانون الاحوال الشخصية العراقي والضرر على حياة المراة والطفل، اجرت الحوار: بيان بدل
حوار مع الكاتب البحريني هشام عقيل حول الفكر الماركسي والتحديات التي يواجهها اليوم، اجرت الحوار: سوزان امين

كيف تدعم-ين الحوار المتمدن واليسار والعلمانية على الانترنت؟

تابعونا على: الفيسبوك التويتر اليوتيوب RSS الانستغرام لينكدإن تيلكرام بنترست تمبلر بلوكر فليبورد الموبايل

كيفية إشراك-إيصال مواضيعكم أو مواضيع تهمكم إلى اكبر عدد ممكن من القراء والقارئات

رأيكم مهم للجميع - شارك في الحوار والتعليق على الموضوع
للاطلاع وإضافة التعليقات من خلال الموقع نرجو النقر على - تعليقات الحوار المتمدن -

تعليقات الفيسبوك () تعليقات الحوار المتمدن (0)

* الاسم الثنائي او الثلاثي

* البريد الالكتروني

* عنوان التعليق

التعـلـيـق

عدد الحروف المتبقية

الاسم يجب ان يكون الثنائي او الثلاثي و بالعربية فقط ولاتقبل الاسماء الرمزية
أعلمني عن التعليقات الجديدة على الموضوع

| نسخة قابلة للطباعة | ارسل هذا الموضوع الى صديق | حفظ - ورد
| حفظ | بحث | إضافة إلى المفضلة | للاتصال بالكاتب-ة
عدد الموضوعات المقروءة في الموقع الى الان : 4,294,967,295