나의 즐겨찾기 | 블로그홈 | 바로가기 바로가기 | 로그인
시작이 있는 곳에 끝이 있다!
블로그  |  사진갤러리  |  동영상갤러리 방명록  |   즐겨찾기 추가
jrogue (jhrogue)
프로필     
오늘 전체
방문자 476 1718083
구독자 0 180
댓글 0 3706
참조글 1 954
 인기도 :
 이 블로그 점수주기
전체 글보기(824)
열린 일기장
메모광
끝없는 뽐뿌질(화)
독서광(목)
새소식 정리(금)
영화광(일)
좌충우돌 해외 여행기
HanRSS 로 구독하기Fish 로 구독하기
 즐겨찾기
 즐겨찾기 글모음
개설일 : 2003/10/02
 

블로그에 대한 단상(10): RSS 뒤집어보기(1)

2004.09.06 09:39 | 메모광 | jrogue

http://kr.blog.yahoo.com/jhrogue/1039869 주소복사

블로그에 대한 단상도 어느덧 10회에 접어들고 있다. 지금까지 블로그에 대한 단상에서는 최대한 기술적인 내용은 배제하고 일반 사용자 관점에서 접근하려고 노력했다. 어느 정도 소기의 목적을 달성했다고 보고, 10회부터는 jrogue군이 강세를 보이는 블로그의 기술적인 측면에 대해 궁금했던 사항을 하나씩 차례로 뒤집어보기로 하자.

이번 연재에서는 RSS자체와 이를 뒷받침하는 배경 기술이 무엇이며, 어떤 과정을 거쳐 성장해왔는지 살펴보며, 다음 연재에서는 실제로 RSS를 제대로 활용하도록 도와주는 몇 가지 유용한 도구를 소개하겠다.



---------------------------------------------------------------------------------------------
1. RSS와 배경 기술과 버전 역사
RSS는 Really Simple Syndication에서 앞자만 딴 줄임말이다. 간단히 말해서, 웹에서 각종 언론 매체의 기사 내용을 배급하는 형식을 의미한다. RSS는 기사에 대한 메타 정보와 실제 정보를 동시에 전송하기 때문에, 프로그램 입장에서 쉽게 가공할 수 있다는 장점이 있다.

예를 들어, jrogue군이 운영하는 엔비(http://jrogue.enbee.com)에서 제공하는 뉴스 기사를 한번 살펴보자.

먼저 일반 웹 브라우저를 사용해서 텍스트로 본 모습이다.
--------------------------------------------------------------------------------------------
2004년 9월 5일 일요일

# 모질라, 브라우저 시장 점유율 15% 돌파가 눈앞에... : 지금 이 글도 불여우로 쓰고 있다. ;)
오전 9시 12분 #
--------------------------------------------------------------------------------------------

다음으로 XML 파싱이 가능한 브라우저를 사용해서 RSS 형식으로 본 모습이다.
--------------------------------------------------------------------------------------------
<?xml version="1.0" encoding="euc-kr" ?>
<rss version="2.0">
<channel>
<title>컴퓨터 vs 책(링크블로그)</title>
     <link     >http://jrogue.enbee.com/</link>
<copyright>Copyright 2004 박재호</copyright>
<pubDate>Sun, 5 Sep 2004 09:12:01 +0900</pubDate>
<lastBuildDate>Sun, 5 Sep 2004 09:13:41 +0900</lastBuildDate>
<description>오픈 소스와 책이 만나면 어떻게 되지?</description>
<language>kr</language>
<generator>Enbee NewsFeeder v1.0</generator>
<item>
<title>모질라, 브라우저 시장 점유율 15% 돌파가 눈앞에...</title>
<description>
<![CDATA[ 지금 이 글도 불여우로 쓰고 있다. ;)
]]>
</description>
<pubDate>Sun, 5 Sep 2004 09:12:01 +0900</pubDate>
      <link      >
<![CDATA[ http://www.w3schools.com/browsers/browsers_stats.asp
]]>
</link>
<guid>
<![CDATA[ http://www.w3schools.com/browsers/browsers_stats.asp
]]>
</guid>
</item>
</channel>
</rss>
</pre>
--------------------------------------------------------------------------------------------

일반 웹 자료를 봐서는 프로그램이 저자가 누군지 언제 작성했는지, 언어가 무엇인지, 무엇으로 만들었는지, 링크가 뭔지를 '프로그램'이 알기는 불가능에 가깝다. 물론 프로그램이 위치나 단어를 통해 추측을 할 수도 있겠지만, 어디까지나 추측으로 끝난다. '사람'을 위한 기반 구조인 HTML은 타이틀과 본문 정보를 제외한 나머지 모든 메타 정보를 누락해리기 때문이다. 하지만, RSS로 만든 자료를 입수하면 XML 파서를 돌려서 본문 정보는 물론이고 각종 메타 정보를 쉽게 추출할 수 있다. RSS 파일 내부에 있는 태그인
title, pubDate, description, generator, copyright, title을 보면 초보자라도 어떤 내용이 들어있을지 쉽게 짐작할 수 있을 것이다.

다시 말해, RSS는 XML을 기반으로 만들어져 있으며, RSS를 사용해서 전송하는 자료는 모두 XML 명세 1.0에 순응해야 한다는 제약 조건이 있다. 물론 일반 독자라면 주로 RSS 피딩을 받는 입장에 서기 때문에 자신의 홈 페이지를 RSS 규약에 맞춰 외부로 피딩하지 않는 이상 기술적인 문제로 고민할 필요는 없는 듯이 보인다.

그렇다면, XML 규약만 충족하면 RSS로 제 구실을 할 수 있을까? 이미 예상 했듯이, 정답은 '아니오'이다. RSS 자체 규약이 존재하기 때문에 RSS를 지원하는 소프트웨어인 뉴스 리더로 읽으려면 반드시 RSS 표준을 준수해야 한다. 그런데, RSS 표준이 상당히 골때리게 되어있으므로, 배경 지식이 없는 독자라면 RSS 표준 문서를 읽다가 길을 잃고 해맬 수 있다.

RSS는 크게 RSS 0.91, RSS 1.0, RSS 0.92, RSS 0.93, RSS 2.0으로 나뉘어진다. 버전 번호가 올라간 모습을 보니 큰 문제가 없는 듯이 보이지만... 버전 번호가 올라간 순서를 보면 뭔가 미심쩍은 구석이 보일 것이다. 왜 RSS 1.0이 중간에 끼어들어 갔을까?

RSS 0.9x 계열은 RDF(Resource Description Format) 기반이 아닌 반면에, RSS 1.0은 RDF 기반의 표준이기 때문이다. 여기서, RDF 기반으로 표준을 만들 경우 깔끔하고 명확하게 정의할 수 있다는 장점이 있지만, 반대급부로 사용이 복잡해지는 단점이 있다. 따라서, RDF 사용을 반대하는 사람들과 RDF 사용을 찬성하는 사람들끼리 격렬한 논쟁이 벌어졌고, 그 결과 표준이 두 동강 나고 말았다. RDF를 찬성하는 쪽에서 RDF에 기반한 RSS 1.0 규약을 발표하자마자 몇개월 지나지 않아 RDF를 반대하는 쪽에서 RDF에 기반하지 않는 RSS 0.92를 발표해버린 것이다. 설상 가상으로 RSS를 반대하는 쪽에서 RSS 0.93에 이어 버전 번호를 RSS 2.0으로 붙이는 바람에 혼란은 더 커지고 말았다.

다행히도, 요즘 나오는 뉴스 리더는 지능적으로 RSS 버전을 감지하도록 설계되어 있기 때문에 최종 사용자 입장에서는 RSS 버전에 관심을 기울일 필요가 없다. 하지만, RSS를 읽어들인 뉴스 리더 개발자나 RSS를 제공하는 웹 개발자 입장에서 이런 버전 차이점은 당분간 상당한 골칫거리로 남아있을 전망이다.

블로그 단상은 최종 사용자를 주요 독자 대상으로 삼고 있기 때문에 각 RSS 표준에 대한 구체적인 설명은 하지 않겠다. 기술적인 내용이 궁금하다면, 말미에 달려있는 링크를 따라 들어가면 필요한 자료를 얻을 수 있을 것이다.

2. RSS 성장기
RSS가 나오게 된 배경을 생각해봐야 한다. 솔직히 말해서 웹이 태동하기 시작한 10년전만 하더라도 웹에서 얻어오는 자료의 양이 얼마되지 않았기에 아침에 1시간만 투자를 하면 전세계의 유명한 웹 사이트를 대충 돌아볼 수 있었다(농담이 아니다).

하지만, 요즘은 정보 통신 관련 신문사 사이트 대문만 방문하는 과정에서도 쉽게 한두시간을 까먹을 수 있다. 설상가상으로 블로그가 출현하면서, 자신이 애독하는 블로그까지 방문하려면 온종일 웹에 코를 박고 있어야 하는 웃긴 상황이 벌어지고 있다.

어떻게 하면 필요한 자료가 사용자를 찾아올 수 있도록 만들까? 초기에는 뉴스 레터 기법을 사용해서 정기 구독한 독자에게 전자편지를 날려주는 방법을 택했었다. 하지만, 하루에 한 두차례 보내는 방법으로는 실시간성이 떨어지고(뉴스의 생명은 실시간!), 매번 전자편지를 확인해야 한다는 점에서 상당히 불편하다는 지적이 있었다.

이런 문제점을 해결하기 위해 등장한 방법이 바로 푸쉬(이 용어를 알면 당신은 웹 세계에서 상당한 경력을 자랑한다고 자신있게 말할 수 있다) 기술인데, 별도 클라이언트를 설치한 다음에 관심있는 사이트를 등록해 놓으면 실시간으로 사용자에게 신착 자료를 배달해주는 획기적인 기능을 제공했기에, 상당한 붐을 불러일으켰다.

하지만, 푸쉬 기술은 특정 업체에 종속적이며(푸쉬 서버를 구매하거나, 특정 업체의 아웃소싱에 의존해야 했다. 그리고 푸시 기술 자체에 대한 표준도 각양각색이었다), 리소스를 많이 잡아먹는 전용 클라이언트를 푸쉬 서비스에 맞춰 여러 개 설치해야 하는 불편함이 있었기에, 잠깐 동안 관심을 끌다가 역사의 뒤안길로 사라져버렸다.

푸쉬 기술이 모멘텀을 잃어버리고 추락하자, 포털 사이트에서 마이 XYZ이라는 서비스를 제공해서 맞춤식 컨텐츠 구성 기술을 선보이기 시작했지만, 그렇게 큰 반향을 불러일으키지 못하고 만다. 안타깝게도 포털로 방향을 선회하던 넷스케이프도 이 와중에서 몰락해버린다.

한동안 뉴스 전달 방식에 있어 암흑기를 맞이한 인터넷 세상이었지만, 의외의 사건이 다시 한번 뉴스 전달 체계를 뒤집어버리는 쾌거를 이룩한다. 바로 '블로그'이다. 일반적인 포털 신문사와는 달리 블로그는 독립적인 개인이 운영하는 간이 신문사라고 볼 수 있으므로, 아무래도 거대자본을 앞세운 포털 사이트와 비교해서 배급력이 떨어질 수 밖에 없다.

배급력을 높이기 위해 초기에 블로그 숫자가 많지 않을 때는 몇몇 자원 봉사자가 수작업으로 디렉토리화시켜서 그룹을 짓는 방법으로 검색과 구독의 편의성을 제공할 수 있었다. 하지만, 블로그 숫자가 기하급수적으로 늘어나면서 한계에 이르게 된다. 아후! 디렉토리처럼 사람을 많이 풀어서 블로그 디렉토리만 별도로 다루는 회사가 아닌 이상, 소프트웨어로 처리할 수 있는 자동화된 뭔가가 필요하게 되고, 유저랜드라는 블로그 툴 회사가 주축이 되어 넷스케이프 큰 형님께서 제안한 개념을 토대로 RSS 표준 규약을 선보이게 된다. RSS 규약만 따르면, 표준화한 방법으로 메타 정보와 본문 정보를 컴퓨터 사이에 나를 수 있으므로 자동으로 블로그 기사를 처리하는 소프트웨어 개발이 가능해지는 셈이다. 기존 푸쉬 기술과는 달리 RSS 규약은 XML 표준을 따르고 있으므로, 특정 업체나 기술에 종속되는 사태를 막아줄 수 있었기에 RSS를 지원하는 각종 서버 소프트웨어, 클라이언트 소프트웨어 숫자는 계속해서 증가하게 되며, 그 결과 단기간에 블로그 표준으로 자리잡을 수 있었다. 개발자나 블로그 운영자를 위한 서버 소프트웨어는 물론 이고, 일반 최종 뉴스 소비자를 위한 윈도우, 리눅스, 맥 OS X, 웹 버전 RSS 뉴스 리더가 등장해서 누구나 손쉽게 블로그 사이트를 정기 구독한 다음에 실시간으로 새소식을 받을 수 있는 여건이 갖춰졌다.

요즘은 블로그 뿐만 아니라 하드웨어/소프트웨어 회사, 일반 기업, 심지어 뉴스 포탈 사이트조차도 RSS를 제공함으로써, 바야흐로 인터넷을 RSS 세계로 만들고 있다.

http://blogs.law.harvard.edu/tech/rss
http://www.oreilly.com/catalog/consynrss/index.html

---------------------------------------------------------------------------------------------
EOF

댓글쓰기

댓글쓰기 입력폼

포스트 목록 닫기

목록보기
 
2009 11월
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
최근 댓글 전체보기
저는 서점에서 읽다가 ..
im kathy , i..
im kathy , i..
im kathy , i..
im kathy , i..
최근 참조글 전체보기
리눅스 * 그냥 재미로
Valtrax onli..
졸곰의 생각
Ambien hallu..
지저깨비의 생각
최근 글
소프트웨어 컨플릭트 2..
[일상다반사] 리눅스 ..
The Art of P..
[공지] '컴퓨..
맥북 국내 판매 개시!..
지난 글
2009년 1월
2009년 2월
2009년 3월
2009년 4월
2009년 5월
2009년 6월
2009년 7월
2009년 8월
2009년 9월
2009년 10월
2009년 11월