Welcome To My Blog: Refrenshi Dan Identitas Pada Web

3.2 Referensi dan Identitas

Setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau yang lain. Masalah dengan label di Web adalah bahwa setiap Sistem pada dasarnya tidak diawasi, sesuai dengan Prinsip-prinsip yang mengatur Web, tapi kurangnya sentralisasi memungkinkan skema yang berbeda dan konvensi, dan selanjutnya dapat mengakibatkan kemungkinan kegagalan referensi unik(URI).

3.2.1 Referensi: Ketika dua benda yang sama?

Desentralisasi adalah masalah dari sudut pandang logis. Objek yang sama mungkin disebut sejalan, sempurna, benar, sebagai 'Jane Doe', 'Janey Doe', 'Jane A. Doe ',' Doe, J.A. 'dan sebagainya. Selanjutnya, salah satu atau semua istilah -istilah ini dapat digunakan untuk merujuk ke objek lain yang berbeda. Dan, tentu saja, aslinya Jane Doe mungkin salah eja: 'Jnae Doe', dll ini kegagalan referensi unik relatif sepele bagi pengguna manusia untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Referensi masalah sangat mungkin terjadi ketika sumber informasi yang digabung, masalah di mana-mana tapi yang serius dalam konteks dari Semantic Web. Dan desentralisasi menghalangi Web membuat asumsi nama yang unik, dalam cara Di sisi lain, URI menyediakan Web dengan sumber untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat memutuskan bahwa kedua istilah ini menunjuk ke URI yang sama..

Sebuah metode heuristik untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah untuk membuat penilaian cerdas berdasarkan informasi jaminan, dan ini telah menirukan online dengan perhitungan komunitas praktek nama, berdasarkan jaringan hubungan sekitarnya masing-masing instansi yang disengketakan. Secara umum, manajemen referensi, dan resolusi referensi masalah, akan selalu sulit mengingat bahwa Web mencakup sejumlah besar informasi mengumpulkan untuk sejumlah alasan yang berbeda dan untuk memecahkan berbagai tugas.

3.2.2 Bila dua halaman yang sama?

Sebuah halaman mengambil alternatif pada masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan sepele dalam banyak kasus, teks "utama" disalin dari satu halaman ke halaman lain, tetapi dikelilingi oleh berbagai iklan, logo, header dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk menentukan kuantitatif tingkat hubungan antara dua halaman. Kesamaan penilaian bisa sembarangan dan pragmatis, tergantung pada konteks (mis memutuskan plagiat atau hak cipta kasus pelanggaran), tetapi teknik dari teori informasi yang ada untuk menghasilkan set tujuan nomor untuk memberi makan ke dalam proses penilaian - misalnya, mengedit Levenshtein jarak, dan varian algoritma, diberikan dengan jumlah minimum operasi dari beberapa basis set yang dibutuhkan untuk mengubah satu kata menjadi lain.

Informasi yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari cluster dokumen seputar topik dasar, dan linkage struktur ada bisa sangat penting. Dan mungkin lebih jauh cara memahami kesamaan antara pola penggunaan tertentu halaman - dua halaman sering diakses pada titik-titik yang sama di Web a browser. kesamaan berbasis konten dapat didekati dengan kata-kata yang cocok atau subsequences dari dua halaman. teknik yang relatif sederhana dapat digunakan untuk menentukan kemiripan antara dua halaman, dan penahanan satu dengan lainnya. Linkbased metrik berasal dari bibliometrics dan analisis kutipan, dan fokus pada link keluar dan link dalam dua halaman memiliki kesamaan, relatif ke ruang umum link di cluster topik.

engineering 3.3 Web: new direction

pengembangan Web merupakan campuran dari penetapan standar, tidak terstruktur, kegiatan desentralisasi dan inovasi. Pada bagian ini kita akan fokus pada yang terakhir, dan meninjau terkemuka masalah teknik dan imperatif terbuka. Pertumbuhan Web adalah jelas sesuatu yang diinginkan. Penyimpanan jumlah yang selalu lebih besar dari informasi, dalam konteks percepatan perhitungan, akan penting bagi masa mendatang. Tanpa penyimpanan cerdas dan pengambilan lebih cepat untuk Media memori seperti video, maka akhirnya Web akan tumbuh terlalu besar untuk teknologi sendiri. Misalnya, PageRank membutuhkan merangkak dan caching dari bagian signifikan dari Web tersebut; keberhasilan Google tergantung pada kemampuan untuk menjaga cache penurut sementara juga ukuran yang signifikan. permintaan yang lebih besar untuk layanan personalisasi dan pencari juga akan memberikan tekanan pada sistem. Memperluas cakupan pencarian untuk mencakup item seperti multimedia, jasa atau komponen ontologi, juga akan memerlukan mengejar program penelitian akademik, interface efektif dan model bisnis yang masuk akal sebelum layanan komersial mulai beroperasi.

3.3.1 layanan Web

Layanan adalah wilayah kunci di mana model rekayasa kami dari Web butuhkan untuk terlibat dan jasa extended. Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui pesan. tugas skala besar dapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan sedikit keberuntungan akan memetakan ke spesifik tugas yang dapat ditangani oleh layanan. Software abstrak jauh dari hardware dan memungkinkan kita untuk menentukan mesin komputasi dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan solusi dalam cara yang relatif intuitif. Sebagai contoh, WS-Net adalah bahasa deskripsi arsitektural berdasarkan teori berwarna Petri net, yang menggambarkan komponen layanan Web dalam hal layanan yang menyediakan komponen lain, layanan yang diperlukan untuk fungsi, dan operasi internal. Hasil akhirnya adalah model yang meliputi aspek baik global dan lokal dari sistem pelayanan, memfasilitasi integrasi layanan Web untuk mencapai tujuan-tujuan baru. Sekali lagi, seperti dengan pendekatan Petri net, penggunaan formal aljabar memungkinkan baik desain dan evaluasi untuk mengambil tempat. Misalnya, menjelaskan pemetaan antara proses aljabar dan BPEL4WS ekspresif, yang memungkinkan kedua penciptaan layanan di BPEL4WS diikuti oleh evaluasi dan verifikasi menggunakan proses aljabar, atau generasi

kode BPEL4WS otomatis dari penggunaan aljabar untuk menentukan layanan yang diinginkan. BPEL4WS adalah versi panjang dari Eksekusi Proses Bisnis Bahasa BPEL, yang menjadi cara yang semakin penting untuk interleave layanan Web dengan proses bisnis. BPEL ada batasnya, tapi memungkinkan penciptaan layanan komposit dari layanan yang ada. Itu Tahap selanjutnya adalah menyesuaikan pendekatan ini untuk lingkungan P2P, dan kendaraan sedang dalam pengembangan untuk itu adalah CDL, alias WS-CDL, sebuah bahasa berbasis XML untuk mendefinisikan umum dan komplementer perilaku yang dapat diamati dalam kolaborasi P2P. Tujuannya adalah agar kolaborasi P2P interoperable dapat disusun dengan menggunakan Koreografi tanpa memperhatikan spesifik seperti platform yang mendasari yang digunakan.

3.3.2 pendekatan terdistribusi: komputasi Pervasif,

P2P dan grid Ada banyak lingkungan hardware yang Web akan diharapkan untuk menembus, namun di mana asumsi rekayasa yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin komputasi didedikasikan tidak selalu berlaku. Contoh yang jelas termasuk komputasi mobile. komputasi mobile membuat segala macam tuntutan rekayasa; daya komputasi yang tersedia tidak luas dan pengguna harus diasumsikan terus-menerus bergerak dengan variabel bandwidth dan akses. Selanjutnya, menyajikan informasi kepada pengguna membutuhkan paradigma yang berbeda dari PC, misalnya untuk memungkinkan pengguna untuk menerima informasi yang cukup pada layar kecil untuk membuat penjelajahan menarik .akses mobile ke Web dapat menjadi modus dominan di banyak negara, terutama yang berkembang, terima kasih untuk harga yang relatif rendah dan keandalan koneksi nirkabel dan baterai kekuatan. Penelitian di bidang ini penting untuk merata distribusi sumber daya Web.

jaringan P2P, ditandai dengan otonomi dari server pusat, konektivitas intermiten dan penggunaan oportunistik dari sumber,adalah lingkungan menarik lain untuk generasi Web berikutnya. Di jaringan seperti (termasuk jaringan file-sharing seperti Napster, komunikasi jaringan seperti Skype, dan jaringan komputasi seperti sebagai SETI rumah @), komputer menjadi komponen dalam terdistribusi sistem, dan mungkin melakukan segala macam hal: back up orang lain ' file, menyimpan fragmen dari file terenkripsi, melakukan pengolahan untuk berskala usaha di latar belakang, dan sebagainya. Ada jelas banyak aplikasi potensial untuk kedua jaringan P2P terstruktur dan tidak terstruktur dalam konteks Web. Pertanyaan bagi para ilmuwan Web adalah apa fungsi penting untuk pengalaman Web dapat dipertahankan di longgar sistem otonom ditambah.

Sistem P2P mengeksploitasi distribusi skala besar untuk mencapai banyak dari ujung kecil, komputasi grid sering merupakan pendekatan didistribusikan ke masalah skala besar menggunakan daya komputasi substansial untuk menganalisis besar jumlah data. Masalahnya adalah mengkoordinasikan perilaku dari sejumlah besar komputer, mengeksploitasi sumber daya yang tidak terpakai oportunis seperti P2P; lagi seperti P2P, dan tidak seperti tradisional didistribusikankomputasi, komputasi grid ini dimaksudkan untuk menjadi netral tentang administrasi atau batas Platform. Oleh karena itu terbuka standar yang diperlukan, dan Grid membutuhkan deskripsi abstrak sumber daya komputasi.

Dengan analogi ke Web Semantic, Grid telah melahirkan SemanticGrid, di mana informasi dan sumber daya komputasi yang dijelaskan dengan metadata (dan sebagai dengan SW RDF adalah bahasa pilihan), memungkinkan eksploitasi spesifikasi mesin yang dapat dibaca untuk koordinasi otomatis sumber daya untuk memecahkan masalah skala besar tertentu Penerapan Grid dan Semantic Grid untuk besar masalah skala menunjukkan janji besar - memang sebagai data dari CERN Large Hadron Collider mulai beroperasi pada gigabyte / detik, Grid adalah sangat diperlukan.

3.3.4 Multimedia

Web adalah lingkungan multimedia, yang membuat untuk kompleks semantik - ini tentu saja tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog. Sebagai contoh ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka Sana memiliki upaya untuk menghasilkan 'bahasa-seperti' taksonomi generatif representasi visual yang ,tetapi ini tidak tampaknya memiliki aplikasi menarik. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip yang mungkin mendasari penalaran diagram . Secara umum, tidak diketahui bagaimana mengambil semantik dari representasi non-tekstual andal; Fenomena ini dikenal sebagai kesenjangan semantik.

Namun demikian, generasi Web berikutnya tidak harus didasarkan pada asumsi yang salah bahwa teks adalah dominan dan kata kunci berbasis penelusuran akan cukup untuk semua tujuan yang wajar . Memang, masalah berkaitan dengan navigasi melalui repositori multimedia seperti video arsip dan melalui Web tersebut tidak berhubungan: baik membutuhkan informasi link untuk mendukung browsing, dan keduanya perlu mesin untuk mendukung pengguna Link traversal.

Sebagai hybrid menarik telah disarankan bahwa kesenjangan semantik bisa diisi dengan ontologi dari visual yang mencakup istilah tingkat rendah dan memberikan semacam pemetaan ke konsep abstrak-tingkat yang lebih tinggi disajikan dalam query dan metadata .Seperti infrastruktur memiliki telah dibuat, menggunakan (i) deskriptor visual yang ontologi didasarkan pada RDF representasi dari MPEG-7 deskripsi visual, (ii) struktur multimedia ontologi berdasarkan skema deskripsi multimedia MPEG-7 dan (iii) inti primitif pemodelan ontologi pada akar konsep hierarki yang dimaksudkan untuk bertindak sebagai jembatan antara ontologi, semua dilengkapi dengan domain ontologi . Selanjutnya penting Masalah terbuka adalah interoperabilitas teknologi Semantic Web dengan metadata berbasis non-RDF seperti EXIF metadata pada file JPEG atau tag gambar informal yang dibuat di Flickr . pekerjaan lebih lanjut diperlukan pada hubungan antara persyaratan pengambilan gambar manusia dan kemungkinan otomatisasi, termasuk pemahaman yang lebih dalam dari kemampuan relatif folksonomi dan ontologi .

3.3.5 pengolahan bahasa alami

Akhirnya, ada isu-isu substansial yang berkaitan dengan pengolahan bahasa alami (NLP), analisis komputasi data tidak terstruktur dalam teks-teks untuk menghasilkan pemahaman mesin (pada tingkat tertentu) dari teks yang. NLP berkaitan dengan Web dalam sejumlah cara. Di tempat pertama, alami Bahasa adalah domain yang sangat jarang, di sebagian besar kalimat yang diucapkan atau ditulis terjadi sekali saja atau sangat jarang, dan skala raksasa Web menyediakan corpus menarik untuk NLP penalaran. Sebuah angka perkiraan baru-baru ini untuk ukuran dari Web adalah dua ribu miliar kata, yang 71% berasal dari Inggris, 6,8% Jepang dan 5,1% Jerman. banyak yang relatif bahasa umum seperti Slovenia atau Melayu bisa membanggakan 100m kata online, ukuran yang sama seperti Nasional Inggris yang banyak digunakan dan dihormati Corpus.

Kedua, mengingat masalah dari skala Web, teknik NLP akan menjadi penting dalam tugas-tugas seperti summarisation yang dapat memberikan dukungan yang berguna untuk bagian-bagian manusia tugas pencarian. Ketiga, NLP memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang heterogen dan belum tentu computerliterateWeb komunitas pengguna membutuhkan. Memang mungkin membantu menjembatani kesenjangan antara visi SW dari Web terdiri dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari Web sebagai tempat yang berguna dokumen yang akan diambil. Komputasi ontologi seperti yang kita jumpai berbeda dalam tujuan dan struktur dari thesaurus dan taksonomi dari dunia NLP, meskipun ada perdebatan tentang tingkat dan sifat dari perbedaan . sumber NLP juga memiliki sesuatu kesamaan dengan folksonomi dan sejenisnya, serta pentingnya perbedaan. Dari sudut pandang Ilmu Web, pertanyaan terbuka yang penting ada sebagai hubungan antara NLP dan Web; adalah statistik teknik yang digunakan dalam NLP bertentangan atau saling melengkapi dengan logis teknik dan semantik berdasarkan interogasi data yang digunakan oleh masyarakat SW? Atau alternatif ada divisi optimal analitis kerja antara dua jenis pendekatan yang kita mungkin mengeksploitasi? Banyak tergantung pada bagaimana kita menafsirkan pengembangan Web. Untuk Misalnya, jika seseorang melihat tugas utama sebagai untuk membubuhi keterangan dan memberikan konteks yang kaya untuk konten dan struktur “menjinakan web” maka NLP akan memainkan peran kunci dalam hal itu, termasuk pemetaan melayang dalam arti dari waktu ke waktu.Jika kita memahami Semantic Web sebagai berfokus pada data dan model database relasional, maka logis Ketentuan dan URI gigih menjadi pusat. NLP bekerja dengan baik statistik; SW, sebaliknya, membutuhkan logika dan belum menggunakan substansial statistik. bahasa alami adalah demokratis, seperti yang diungkapkan dalam slogan 'artinya adalah menggunakan' . Setara dalam SW dari kata-kata bahasa alami adalah hal yang logis, yang URI yang menonjol.

Welcome To My Blog

Kamis, 16 Juni 2016

Refrenshi Dan Identitas Pada Web

Tidak ada komentar:

Posting Komentar

Tugas : Hasil dan Analisa Pemrograman Jaringan

Pengikut

Animasi