HTML parser
- 최초 등록일
- 2006.12.20
- 최종 저작일
- 2006.01
- 압축파일
- 가격 1,000원
소개글
"a href", "img src"에서 사용되는 URL 목록을 추출하는 프로그램 작성
추출된 목록을 output file에 출력한다.
분석해야 할 html page의 이름과 output file의 이름을 run time parameter로 받을 수 있도록 한다.
컴파일 실행환경
VC++ compiler / Visual Studio 6.0
본문내용
#include "htmlParser.h"
void FileReader(FILE *input, FILE *output)
{
char line[MAXSTRING];
char *tracer, *temp;
while (!feof(input)) {
fgets(line, MAXSTRING, input);
for (tracer = line; *tracer; tracer++)
{
if (*tracer == `<`)
{
if (MakeSmallLetter(*(tracer+1)) == `a` ) {
if (*(tracer+2) == ` ` || *(tracer+2) == `\n`) {
tracer += 2;
temp = GetLinkAddress(tracer, input);
if (temp != NULL) {
WriteInFile(temp, output);
}
}
else
{
tracer += 2;
}
}
압축파일 내 파일목록
HTMLparser.dsp
HTMLparser.dsw
htmlParser.h
HTMLparser.ncb
HTMLparser.opt
HTMLparser.plg
input1.htm
input1.txt
input2.txt
input3.txt
input4.txt
input5.txt
input6.txt
main.c
output1.txt
output2.txt
output3.txt
output4.txt
output5.txt
output6.txt
output7.txt
parser.c
Debug/HTMLparser.exe
Debug/HTMLparser.ilk
Debug/HTMLparser.pch
Debug/HTMLparser.pdb
Debug/main.obj
Debug/parser.obj
Debug/vc60.idb
Debug/vc60.pdb
참고 자료
없음