Mengonfigurasi tabel dan hubungan di Azure Synapse Lake

Dalam artikel ini, kita akan mempelajari cara mengonfigurasi properti dan hubungan di Azure Synapse Lake Database.

pengantar

Dalam artikel saya sebelumnya, Memulai dengan Azure Synapse Lake Database dan tabel Lake, kami mempelajari cara membuat instance Azure Synapse dan membuat Database Lake serta tabel di dalamnya. Kami membuat data di Azure Data Lake Storage dan kemudian membuat struktur data di Azure Synapse Lake Database dan mengonfigurasi struktur ini untuk diintegrasikan dengan data, dan akhirnya berhasil mengakses data ini. Dalam skenario produksi, ada ratusan tabel yang biasanya dapat dimodelkan dengan cara tertentu dengan batasan dan hubungan. Selain itu, hasilnya mungkin memerlukan analisis dengan cara yang lebih grafis daripada hanya data dalam format tabel yang direpresentasikan pada kisi data. Database Azure Synapse Lake, serta Tabel menyediakan cara grafis dan intuitif untuk mengonfigurasi batasan, properti, dan hubungan tabel.

Mengonfigurasi properti Azure Synapse Database dan Tabel

Diasumsikan bahwa seseorang telah mengikuti dua artikel sebelumnya di Azure Synapse Lake Database dan membuat instance dan tabel Lake Database di dalamnya. Ini adalah prasyarat mutlak untuk melanjutkan langkah-langkah lainnya dalam latihan ini. Di artikel terakhir, kami mengakhiri dengan pembuatan tabel Pelanggan yang menunjuk ke file data yang dihosting di Penyimpanan Azure Data Lake. Katakanlah kita bermaksud untuk mengkloning tabel ini untuk alasan apa pun, biasanya untuk membuat salinan atau arsip dari tabel yang sama di mana skema tabelnya identik, tetapi datanya berbeda. Dalam hal ini, kita dapat mengklik elipsis tabel Pelanggan seperti yang ditunjukkan di bawah ini, dan kita akan mendapatkan opsi untuk mengkloning tabel ini dengan mudah.


Sekarang tabel sudah ada, kita bisa mulai melihat konfigurasi default dan menyesuaikannya sesuai kebutuhan. Klik pada tabel dan panel konfigurasi akan muncul di bagian bawah seperti yang ditunjukkan di bawah ini. Ini memiliki tiga tab – Umum, Kolom dan Hubungan. Mari kita lihat ketiganya satu per satu. Dalam Umum tab properties, kita akan menemukan opsi untuk mengubah nama tabel, deskripsi, dan folder tampilan di mana tabel tersebut terdaftar saat browsing. Kumpulan properti berikutnya di bagian ini terkait dengan penyimpanan. Kami dapat mengonfigurasi tabel untuk mewarisi semua properti seperti layanan tertaut, folder input, dan properti relevan lainnya dari konfigurasi instance Azure Synapse Lake Database itu sendiri dengan memilih kotak centang berjudul Mewarisi dari database default.


Properti Umum

Properti lain yang terkait dengan tabel yang dapat kita modifikasi dari bagian ini adalah layanan tertaut, folder input atau lokasi file, dan format data. Pilihan lain seperti Baris Header memungkinkan multiline dalam data, Data Delimited, Kompresi dan Partisi dapat dikonfigurasi tergantung pada jenis data yang akan di-host di sumber data.


Properti penyimpanan

Tab berikutnya adalah kolom tab di mana kita dapat menemukan semua kolom yang tercantum dalam tabel. Ini adalah tempat dari mana kita dapat memodifikasi skema tabel. Kita dapat menambahkan batasan seperti Kunci Utama dengan memilih kotak centang yang relevan terhadap setiap nama bidang. Kami juga dapat memodifikasi tipe data serta panjang atau presisi data dari sini. Kapan saja, kami juga dapat menambah atau menghapus bidang dari tab ini. Untuk menyimpan perubahan ini, perlu untuk memublikasikan perubahan jika tidak, perubahan akan dibuang dari ruang kerja.


Definisi kolom

Katakanlah kita ingin menjadikan bidang CustomerID di tabel Pelanggan sebagai kunci utama, sehingga kita dapat mencentang kotak PK dan menghapus centang pada kotak Null dan mempublikasikan perubahan. Saat kita memilih dua atau lebih bidang dengan tipe data yang sama, kita dapat menggunakan opsi menu Convery Type untuk mengonversi kolom secara massal dari satu tipe ke tipe lainnya.


Kunci utama

Tab berikutnya dan terakhir di panel konfigurasi adalah Hubungan tab. Di tab ini, kami memiliki opsi untuk menentukan hubungan untuk tabel. Hubungan bisa masuk dan juga keluar. Dengan kata sederhana, itu berarti bahwa sebuah tabel dapat memiliki kunci sebagai kunci asing, yang mungkin merupakan kunci utama dari tabel lain. Dengan kata lain, hubungan dimana tabel adalah tabel anak. Cara hubungan lain adalah di mana tabel bertindak sebagai tabel master dan kunci utamanya digunakan sebagai kunci asing di tabel lain. Di sini kami memiliki ketentuan untuk mendefinisikan kedua jenis hubungan dari berbagai tabel yang ditentukan dalam instance Azure Synapse Lake Database. Untuk mencoba mengonfigurasi fitur hubungan, kita memerlukan setidaknya satu tabel.


Hubungan

Ikuti langkah-langkah yang kami lakukan sebelumnya untuk mendaftarkan tabel Pelanggan dan mendaftarkan tabel lain menggunakan file data berbeda yang dihosting di Azure Data Lake Storage. Dalam hal ini, saya telah membuat tabel Alamat yang memiliki ID Pelanggan sama dengan yang ada di tabel Pelanggan. Setelah tabel ini terdaftar, tampilannya seperti gambar di bawah ini. Di sini kami sengaja menyimpan nama bidang sebagai C1, C2 dan seterusnya untuk mensimulasikan situasi di mana nama bidang mungkin tidak identik dalam dua tabel.


Beberapa tabel terdaftar di Azure Synapse Lake Database

Sekarang untuk menentukan hubungan untuk tabel Alamat yang baru dibuat, pilih tabel ini dan klik item menu Hubungan seperti yang ditunjukkan di bawah ini. Pilih Ke meja option sebagai tabel Pelanggan bertindak sebagai tabel induk ke tabel Alamat. Setelah kami memilih opsi ini, baris detail akan muncul seperti yang ditunjukkan di bawah ini.


Hubungan dalam Database Azure Synapse Lake

Di sisi kiri, pilih tabel Pelanggan dengan bidang sebagai ID Pelanggan, dan di sisi kanan, kami akan memilih tabel Alamat dengan bidang yang relevan yang memiliki ID Pelanggan yaitu bidang kunci asing.


kriteria bergabung

Sekarang hubungan didefinisikan, dan kedua tabel sekarang terkait. Kita dapat membuka jendela skrip untuk menjelajahi data dari tabel terkait ini juga. Seperti yang ditunjukkan di bawah ini, di sini kita memiliki kueri SQL yang menggabungkan dua tabel di bidang ID Pelanggan. Klik tombol Run untuk mengeksekusi query dan hasilnya seperti di bawah ini.


Hasil Tabel

Secara default, data ditampilkan dalam opsi tabular tetapi ada lebih banyak yang dapat kita lakukan dengan data ini juga. Ada opsi untuk mengekspor data ini dalam format seperti CSV dan JSON. Katakanlah kita bermaksud untuk mengeksplorasi data ini secara grafis. Kami tidak perlu menyalin atau mengekspor data ini dan membawanya ke alat lain untuk membuat bagan dasar menggunakan data ini. Opsi ini tersedia di antarmuka hasil yang sama. Klik pada opsi Bagan karena kami akan dapat menemukan opsi bagan seperti yang ditunjukkan di bawah ini.

Beberapa jenis bagan didukung dan tergantung pada jenis bagan, opsi untuk mengonfigurasi bagan dapat bervariasi. Dalam hal ini, kami memiliki kueri di mana kami menghitung jumlah pelanggan yang dikelompokkan berdasarkan judul mereka. Data ini menunjukkan distribusi pelanggan berdasarkan atribut, dan diagram lingkaran adalah salah satu diagram yang paling sederhana dan banyak digunakan untuk menunjukkan distribusi data. Kita hanya perlu memilih tipe bagan sebagai pai dan kategori sebagai judul, dan bagan akan terlihat seperti yang ditunjukkan di bawah ini. Ini dapat mengekspor gambar bagan ini juga dalam format seperti jpeg dan png.


Hasil dalam bagan

Dengan cara ini, kita dapat memodelkan metadata dari Database dan Tabel Azure Synapse Lake dan menjelajahi data dengan cara yang intuitif.

Kesimpulan

Dalam artikel ini, kami mempelajari cara menggunakan pemodel visual untuk mengonfigurasi properti dan hubungan yang terkait dengan Database dan Tabel Azure Synapse Lake dan menjelajahi data secara intuitif dari beberapa tabel.

Gauri Mahajan
Posting terbaru oleh Gauri Mahajan (Lihat semua)

Pemulihan Data