it-swarm.asia

أداة لتوليد مجموعات بيانات كبيرة من بيانات الاختبار

في كثير من الأحيان عند محاولة التوصل إلى تصميم فعال لقاعدة البيانات ، فإن أفضل مسار للعمل هو بناء نموذجين من قواعد البيانات ، وملئها بالبيانات ، وتشغيل بعض الاستعلامات ضدها لمعرفة أيهما يعمل بشكل أفضل.

هل هناك أداة ستنشئ (بشكل مثالي مباشرة في قاعدة البيانات) مجموعات كبيرة (~ 10000 سجل) من بيانات الاختبار بسرعة نسبية؟ أبحث عن شيء يعمل على الأقل مع MySQL.

25
BenV

أفضل أداة (إذا كنت تستطيع العثور عليها) هي DataFactory. (للأسف نفدت الطباعة). لقد قمت بإنشاء مجموعات بيانات ممتعة للغاية (وتبدو أصيلة تمامًا) منها.

موقع Generatedata.com مقبول ... ولكنه لا يتدرج جيدًا.

DataGenerator شيء يجب الانتباه إليه.

وعلى الرغم من أن DTM Data Generator غير مكتمل وبديل ضعيف لـ DataFactory ، فهو موجود ويتم بيعه ، وقد استخدمته لإنشاء بيانات مقبولة بشكل معتدل.

12
Brian Ballsun-Stanton

يحتوي RedGate على أداة مشابهة لما تبحث عنه ، ولكن الوجهة المقصودة هي MS SQL Server.

http://www.red-gate.com/products/sql-development/sql-data-generator

يمكنك أيضًا الاطلاع على المقالة التالية:

http://www.sqlservercentral.com/articles/Advanced+Querying/jointestdata/197/

9
Jeff

عادةً ما أقوم بإنشاء بياناتي الخاصة ، باستخدام بعض البيانات المعروفة كمدخل - إذا كانت أيضًا عشوائيًا ، فهي ليست دائمًا اختبارًا جيدًا ؛ أحتاج إلى بيانات سيتم توزيعها بشكل مماثل لمنتجي النهائي.

جميع قواعد البيانات الأكبر حجمًا التي يجب أن أضبطها علمية بطبيعتها - لذلك يمكنني عادةً إجراء بعض الاستقصاءات الأخرى كمدخلات ، وإعادة قياسها وإضافة التشويش. (على سبيل المثال ، أخذ البيانات التي كانت في إيقاع 5 دقائق بدقة ملي ثانية ، وتحويلها إلى إيقاع 10 ثوانٍ مع الدقة في الثانية ، ولكن غضب +/- 100 مللي ثانية إلى الوقت)

...

ولكن ، كبديل آخر ، إذا كنت لا تريد كتابة ما تريده ، هو النظر إلى بعض أدوات قياس الأداء - حيث يمكنهم تكرار الأشياء مرارًا وتكرارًا بناءً على مجموعة التدريب ، يمكنك استخدامها لإدخال الكثير من السجلات (ثم تجاهل التقارير حول مدى السرعة التي قامت بها) ... ثم يمكنك استخدام نفس الأداة لاختبار مدى سرعة أداء قاعدة البيانات بمجرد ملؤها.

4
Joe

لقد تم استخدام mysqlslap. ينظف بعده أيضًا.

هنا المقال قرأت عندما بدأت استخدامه.

3
SteveHarville

نلقي نظرة على هذه الوظيفة. يمكنك إنشاء أسماء وعناوين أرقام هاتفية ورموز بريدية وما إلى ذلك. يتم ذلك بالكامل في MYSQL ولا حاجة لتطبيقات أخرى. http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function

2
Sean Thompson

ألق نظرة على benerator

ليس من السهل البدء به ، ولكنه قوي جدًا.

2
a_horse_with_no_name

ربما تكون الطريقة الأكثر فعالية من حيث التكلفة هي استخدام مصدر مفتوح أو منشئ بيانات تجارية. إعتدت على فعل ذلك.

الآن ، في سنواتي الذهبية ، أعتبر كل حاجة لبيانات الاختبار بمثابة تفويض لتعلم لغة برمجة نصية أخرى.

1
Mike Sherrill 'Cat Recall'

لأي شخص يبحث عن حل مختلف لهذه المشكلة ... كتبت مشروع مولد بيانات تجريبي لـ Data Synchronization Studio. يمكن أن تولد مجموعة بيانات كبيرة تتراوح من 1 إلى 100 من ملايين صفوف اختبار البيانات الواقعي. هذه مدونة عن كل شيء عنها. http://www.simego.com/Blog/2012/02/Test تتطلب-Generator-Download-for للدول-Sync إنه مجاني للاستخدام لمدة 15 يومًا (بمجرد الحصول على بيانات الاختبار الخاصة بك ، لديك)

1
Tremayne Christ