Beautiful Soup & Selenium
·
HTML & 웹크롤링
Beautiful Soup HTML을 분석하는 파이썬 HTML Parser웹 스크래핑(Web Scraping)을 통해 HTML 문서에서 특정 데이터를 추출하려면 HTML을 분석할 수 있는 도구가 필요합니다. 파이썬에서는 BeautifulSoup 라이브러리를 이용하여 HTML을 쉽게 다룰 수 있습니다.BeautifulSoup 개요requests 모듈을 통해 웹페이지의 HTML을 가져올 수 있습니다.BeautifulSoup을 이용하면 HTML을 손쉽게 파싱하여 원하는 요소만 추출할 수 있습니다.HTML의 Locator를 이용한 요소 찾기웹페이지에서 원하는 데이터를 가져오려면 특정 HTML 요소를 정확하게 선택해야 합니다. 이를 위해 HTML의 Locator 속성인 id와 class를 활용할 수 있습니다.id..
Web 스크래핑 기초
·
HTML & 웹크롤링
Web 스크래핑 기초 인터넷 사용자 간의 약속, HTTP컴퓨터 한 대에서 Web까지의 여정네트워크(Network): 두 대 이상의 컴퓨터를 연결하는 기술근거리 지역 네트워크(Local Area Network, LAN): 같은 지역 내 컴퓨터들을 연결인터넷(Internet): 전 세계의 네트워크를 연결한 거대한 네트워크웹(World Wide Web, Web): 인터넷을 통해 정보를 주고받을 수 있는 환경웹에서 정보 주고받기클라이언트(Client): 정보를 요청하는 컴퓨터서버(Server): 정보를 제공하는 컴퓨터클라이언트가 서버에 요청(Request)을 보냄서버가 요청을 처리하고 응답(Response)을 보냄클라이언트가 응답을 받아 화면에 표시HTTP(Hypertext Transfer Protocol)웹에..
Html 기본 개념 - 콘텐츠, 양식 태그, 주의사항
·
HTML & 웹크롤링
Html 기본 개념(2) HTML 콘텐츠 요소 정리제목 태그 (h1 ~ h6)문서의 구획을 나누는 제목 태그(Heading)h1부터 h6까지 사용 가능하며, 숫자가 클수록 중요도가 낮아짐h1 태그는 페이지 내에 한 번만 사용해야 하며, 계층 구조를 준수해야 함문단 태그 (p)하나의 문단(Paragraph)을 나타내는 태그제목 태그와 함께 또는 단독 사용 가능블록 요소이지만 레이아웃 용도로 사용하면 안 됨굵은 텍스트: 단순히 굵은 글씨를 만들지만 의미를 부여하지 않음: 굵은 글씨로 변경하면서 "강조" 의미 포함태그는 의미를 가지지 않고 단순히 굵은 글씨로 변경만 해준다. bold- 프로그래머스에 오신걸 환영합니다. 태그는 굵은 글씨로 변경 후 "강조"의 의미를 부여한다. - 프로그래머스의 강의를 듣고 개발..
HTML 기본 개념 - Head & Body & 레이아웃
·
HTML & 웹크롤링
Html 기본 개념(1) HTML 개요HTML 기본 문법HTML은 태그(Tag)로 이루어진 마크업 언어입니다.태그는 여는 태그(시작 태그)와 닫는 태그(종료 태그)로 구성됩니다.콘텐츠: 시작 태그, : 종료 태그: 콘텐츠를 가지지 않는 셀프 클로징(Self-closing) 태그속성과 값(Attribute & Value)태그에는 추가적인 정보를 제공하기 위해 속성을 설정할 수 있습니다.Contenttitle: 속성(Attribute)"제목": 속성 값(Value)네이버 바로가기 태그: 하이퍼링크 생성href: 링크의 URL을 지정하는 속성네이버 바로가기: 사용자가 보는 링크 텍스트HTML 기본 문서 구조 안녕하세요! 부모 요소와 자식 요소HTML은 중첩 구조를 가집니다.들여쓰기를 통해 부모 요..