it-swarm.asia

Alat untuk menghasilkan kumpulan data uji yang besar

Sering kali ketika mencoba membuat desain basis data yang efisien, tindakan terbaik adalah membangun dua basis data sampel, mengisinya dengan data, dan menjalankan beberapa pertanyaan terhadap mereka untuk melihat mana yang berkinerja lebih baik.

Apakah ada alat yang akan menghasilkan (idealnya langsung ke dalam database) besar (~ 10.000 catatan) set data uji yang relatif cepat? Saya mencari sesuatu yang setidaknya berfungsi dengan MySQL.

25
BenV

Alat terbaik (jika Anda bisa menemukannya) adalah DataFactory. (Sayangnya tidak dicetak). Saya telah menghasilkan dataset yang benar-benar menyenangkan (dan terlihat sangat asli) darinya.

Generatedata.com adalah ... dapat diterima, tetapi skalanya tidak terlalu baik.

DataGenerator adalah sesuatu yang harus diperhatikan.

Dan sementara Generator Data DTM adalah kikuk dan pengganti yang buruk untuk DataFactory, itu ada dan sedang dijual, dan saya telah menggunakannya untuk menghasilkan data yang dapat diterima.

12

RedGate memiliki alat yang mirip dengan apa yang Anda cari, tetapi tujuannya ditujukan untuk MS SQL Server.

http://www.red-gate.com/products/sql-development/sql-data-generator

Anda mungkin juga melihat artikel berikut:

http://www.sqlservercentral.com/articles/Advanced+Querying/jointestdata/197/

9
Jeff

Saya biasanya menghasilkan sendiri, menggunakan beberapa data yang dikenal sebagai input - jika itu terlal acak, itu tidak selalu merupakan tes yang baik; Saya membutuhkan data yang akan didistribusikan mirip dengan produk akhir saya.

Semua database yang lebih besar yang saya harus sempurnakan bersifat ilmiah - jadi saya biasanya dapat mengambil beberapa penyelidikan lain sebagai input, dan mengubah skala dan menambahkan jitter. (misalnya, mengambil data yang berada pada irama 5 menit dengan ketepatan milidetik, dan mengubahnya menjadi irama 10 detik dengan ketepatan milidetik tetapi jitter +/- 100 ms sesuai waktu)

...

Tetapi, sebagai alternatif lain, jika Anda tidak ingin menulis sendiri, adalah dengan melihat beberapa alat benchmarking - karena mereka dapat mengulangi hal-hal berulang berdasarkan pada set pelatihan, Anda dapat menggunakannya untuk memasukkan banyak catatan (dan kemudian abaikan saja laporan tentang seberapa cepat itu melakukannya) ... dan kemudian Anda dapat menggunakan alat yang sama untuk menguji seberapa cepat kinerja database setelah itu diisi.

4
Joe

Saya telah menggunakan mysqlslap. Itu membersihkan setelah dirinya sendiri juga.

Inilah artikel Saya membaca ketika saya mulai menggunakannya.

3
SteveHarville

Lihatlah fungsi ini. Anda dapat menghasilkan nama, alamat nomor telepon, kode pos dll. Ini sepenuhnya dilakukan di MYSQL tidak perlu untuk aplikasi lain. http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function

2
Sean Thompson

Lihat benerator

Ini tidak mudah untuk memulai, tetapi cukup kuat.

2

Cara yang paling hemat biaya mungkin menggunakan sumber terbuka atau generator data komersial. Saya biasa melakukan itu.

Sekarang, di tahun-tahun emas saya, saya menganggap setiap kebutuhan akan data uji sebagai mandat untuk mempelajari bahasa skrip lain.

Bagi siapa pun yang mencari solusi yang berbeda untuk masalah ini ... Saya menulis proyek generator data uji untuk Studio Sinkronisasi Data. Ini dapat menghasilkan dataset besar mulai dari 1 hingga 100-an juta baris data pengujian realistis. Berikut adalah posting blog tentang hal itu. http://www.simco.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync Gratis untuk digunakan selama 15 hari (setelah Anda memiliki data pengujian Anda , kamu memilikinya)

1
Tremayne Christ