Friday, December 23, 2016

JSOUP JAVA HTML PARSER

JSOUP JAVA HTML PARSER


JSOUP adalah sebuah library java yang bekerja  untuk Dunia HTML. Jsoup menyediakan API yang sangat nyaman untuk extracting dan manipulasi data menggunakan DOM,CSS, dan Jquery.
beberapa fungsi JSOUP :

  • Mengikis dan Mengurai Html dari sebuah URL, file, atau String
  • Menemukan dan mengextract data , menggunakan DOM traversal atau css selector
  • Memanipulasi elemen HTML, attribut dan Teks
  • Membersihkan konten user-submited terhadap sebuah white-list yang aman, untuk mencegah serangan XSS attack
  • Hasil HTML RAPI
JSOUP juga merupakan library yang bersifat open source (gratis atau tidak berbayar)
EXAMPLE
Ambil Wikipedia Homepage, di parsing ke DOM (Documen Object Model), dan pilih headline dari bagian berita disimpan ke dalam sebuah list Elements

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

bagi yang ingin mendownload JSOUP Library dapat di unduh di situs resmi JSOUP dengan mengklik DOWNLOAD ini


Available link for download