Watson adalah sistem komputer spesialisasi tanya-jawab. Mesin ini berbasis server IBM Power7 dan peranti lunak tanya-jawab IBM DeepQA. Adapun mesinnya terdiri atas 90 server IBM Power 750 termasuk tambahan input/output, jaringan, dan node pengontrol cluster dalam 10 rak. Total core atau intinya adalah 2.880, dan RAM-nya mencapai 16 Terabita.
Tiap server memakai delapan core prosesor dengan kecepatan 3,4 GHz dan empat thread untuk tiap core-nya. Proses kerjanya dilakukan secara paralel, yang cocok untuk DeepQA.
Tiap server memakai delapan core prosesor dengan kecepatan 3,4 GHz dan empat thread untuk tiap core-nya. Proses kerjanya dilakukan secara paralel, yang cocok untuk DeepQA.
Power7 adalah prosesor multi-core, tersedia dengan 4, 6, atau 8 core. Ada juga modus TurboCore khusus yang dapat mematikan setengah dari core dari prosesor delapan inti, tetapi 4 core memiliki akses ke semua kontroler memori dan L3 cache pada kecepatan clock meningkat. Hal ini membuat kinerja masing-masing inti yang lebih tinggi yang penting untuk beban kerja yang memerlukan core tercepat mungkin. Modus TurboCore dapat mengurangi "biaya perangkat lunak dalam setengah untuk aplikasi yang berlisensi per inti, sambil meningkatkan per kinerja inti dari perangkat lunak tersebut." baru IBM Power ® 780 scalable, high-end server menampilkan mengoptimalkan TurboCore ™ beban kerja baru mode dan menghadirkan kinerja ganda per inti dari sistem berbasis POWER6
Masing-masing inti mampu empat arah multithreading simultan (TPS). Power7 ini memiliki sekitar 1,2 miliar transistor dan besar 567 mm2 dibuat pada proses 45 nm. Perbedaan penting dari POWER6 adalah Power7 mengeksekusi instruksi out-of-order bukan di-order. Meskipun penurunan frekuensi maksimum dibandingkan dengan POWER6 (4,25 GHz vs 5.0 GHz), masing-masing inti memiliki kinerja lebih tinggi dari POWER6, sementara memiliki sampai 4 kali jumlah core.
Setiap inti prosesor Power7 agresif mengimplementasikan out-of-order (OOO) eksekusi instruksi untuk mendorong efisiensi tinggi dalam penggunaan jalur eksekusi yang tersedia. Prosesor Power7 memiliki Unit Instruksi urutan yang mampu mengirimkan sampai enam instruksi per siklus ke set antrian hingga delapan instruksi per siklus dapat diberikan kepada unit Instruksi Eksekusi.
Perangkat lunak Watson ditulis di Java dan C + + dan menggunakan kerangka Apache Hadoop untuk komputasi terdistribusi, kerangka Apache UIMA (Informasi Arsitektur Manajemen terstruktur), perangkat lunak DeepQA IBM dan sistem operasi SUSE Linux Enterprise Server 11. "[...] lebih dari 100 teknik yang berbeda digunakan untuk menganalisis bahasa alami, mengidentifikasi sumber-sumber, mencari dan menghasilkan hipotesis, menemukan dan skor bukti, dan menggabungkan dan peringkat hipotesis. "
Apache Hadoop mengembangkan proyek perangkat lunak open source untuk diandalkan, komputasi terukur, didistribusikan. Apache Hadoop software perpustakaan adalah suatu kerangka kerja yang memungkinkan untuk pemrosesan terdistribusi set data yang besar di cluster komputer menggunakan model pemrograman sederhana. Hal ini dirancang untuk skala dari server tunggal untuk ribuan mesin, masing-masing perhitungan menawarkan lokal dan penyimpanan. Daripada mengandalkan perangkat keras untuk memberikan high-avaiability, perpustakaan itu sendiri dirancang untuk mendeteksi dan menangani kegagalan pada layer aplikasi, sehingga memberikan layanan yang sangat-availabile di atas sebuah cluster komputer, masing-masing yang mungkin rentan terhadap kegagalan.
UIMA adalah sistem perangkat lunak yang menganalisis besar volume informasi tidak terstruktur dalam rangka untuk menemukan pengetahuan yang relevan dengan pengguna akhir. Sebuah contoh aplikasi UIM mungkin mencerna teks biasa dan mengidentifikasi entitas, seperti orang, tempat, organisasi, atau hubungan.
UIMA memungkinkan aplikasi yang akan didekomposisi menjadi komponen, misalnya "bahasa identifikasi" => "bahasa segmentasi spesifik" => "kalimat batas deteksi" => "entitas deteksi (orang / nama tempat dll)". Masing-masing komponen mengimplementasikan antarmuka yang didefinisikan oleh kerangka kerja dan menyediakan self-describing metadata melalui file deskriptor XML. Kerangka mengelola komponen dan aliran data antara mereka. Komponen ditulis di Jawa atau C + +, data yang mengalir antara komponen dirancang untuk pemetaan efisien antara bahasa-bahasa.
Piranti lunak DeepQA IBM ini diciptakan untuk mampu menganalisis bahasa yang rumit, memberikan jawaban yang tepat atas petunjuk, seperti di Jeopardy!. Semuanya dilakukan secara bersamaan, dalam kecepatan tinggi, dan menganalisis informasi secara real time.
Rujukan:
Rujukan:
0 komentar:
Posting Komentar