[PHP] node.js를 윈도우 서버에 설치하고 peppeteer 라이브러리를 이용하여 og:image를 추출해 보자
페이지 정보

짧은주소
-
https://yadolee.com/tip/1135 주소복사
평점
본문
📝 node.js를 윈도우 서버에 설치하고 peppeteer 라이브러리를 이용하여 og:image를 추출해 보자
일반적으로 curl로 HTML 메타 태그를 파싱할 수 있으나 Meta 플랫폼 서비스(페이스북, 스레드 등)는 대부분의 콘텐츠를 로그인 사용자 기반의 클라이언트 렌더링으로 제공해서 curl이나 일반 HTTP 요청으로는 HTML 메타 태그를 추출할 수 없다.
1. Node.js 설치
https://nodejs.org/ko 접속하여 LTS 버전 다운로드 후 Node.js를 설치한다.

설정 마지막 단계 tool for Native Modules의 체크 박스를 선택하지 않고 설치한다.
2. Puppeteer 설치
cmd 창이나 터미널 창을 열어 아래 명령어를 입력한다.
mkdir C:\puppeteer
cd C:\puppeteer
npm init -y
npm install puppeteer
3. ogimage.js 작성
puppeteer가 설치된 폴더에 아래 소스 코드로 ogimage.js 파일을 작성한다.
const puppeteer = require('puppeteer');
(async () => {
const url = process.argv[2];
if (!url || !url.startsWith('http')) {
console.log('');
process.exit(0);
}
const browser = await puppeteer.launch({
headless: true,
args: ['--no-sandbox', '--disable-setuid-sandbox']
});
const page = await browser.newPage();
// 일반적인 브라우저처럼 가장 널리 호환되는 User-Agent 설정
await page.setUserAgent(
'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36'
);
try {
await page.goto(url, { waitUntil: 'networkidle2', timeout: 15000 });
// og:image만 추출
const ogImage = await page.evaluate(() => {
const meta = document.querySelector('meta[property="og:image"]');
return meta ? meta.content : '';
});
console.log(ogImage || '');
} catch (err) {
console.log('');
} finally {
await browser.close();
}
})();
4. PHP에서 활용
$node = 'C:\\Program Files\\nodejs\\node.exe';
$script = 'C:\\puppeteer\\ogimage.js';
$url = '이미지를 추출할 url 주소';
$command = "\"$node\" \"$script\" \"$url\"";
exec($command, $output, $result_code);
if ($result_code === 0 && !empty($output))
$og_image = trim(implode("\n", $output));
$url은 preg_match를 활용해서 추출한다.
추출한 $og_image의 이미지 주소를 이용해 서버에 다운로드 하고 가공해 활용하도록 한다.
추천인 2

레벨 147
경험치 3,231,227
Progress Bar 27.05%
- 가입일 : 2015-03-10 12:21:44
- 서명 : 인간에게 가장 큰 선물은
자기 자신에게 기회를 주는 것이다.
- 크리스 가드너, Chris Gardner -
- 자기소개 : There's never a shortcut to happiness.
-
2 [Web Server Tip] 그누보드(영카트) 5.6.14+12025-06-14
-
[공유 자료실] Rufus 4.82025-06-12
-
[좋은 생각] ’왜’ 살아야 하는지 아는 사람2025-06-09
-
[좋은 생각] 가장 중대한 실수2025-06-09
-
[좋은 생각] 결단은 되도록 안 하는 편이 좋습니다2025-06-08
-
[좋은 생각] 일 잘하는 사람은 단순하게 합니다2025-06-08
-
[루루에게] 루루가 떠난 지 10년 11개월 13일 째(4000일) 되는 날+22025-06-06
-
1 [Web Server Tip] PHP에서 변수의 값이 날짜 형식이고 유효한 날짜 형식인지 검증해 보자+12025-06-06
-
[일일 메모장] 공감되는 말씀입니다2025-06-03
-
[일일 메모장] 그 어떤 후보도 내게 직접적인 득이 될 수 없다면 내 친지와 내 이웃에게 득이 될 것 같은 후보를 뽑으시고 여러모로 따져 보고 헤아려 보아도 그런 자질을 갖춘 이를 찾을 수 없다면 내 나라에 더 득이 되어 줄 후보를 뽑으셨으면 좋겠습니다 어쩌면 내 코가 석 자라는 말도 자유가 없다면 배 부른 소리 일 수 있습니다 어느 개념있는 배우에 대한 기사로 갈음하고 싶습니다 {글} 꼭 소중한 투표 행사하셨으면 합니다2025-06-03
-
[자유 게시판] 저 또한 소중한 하나 표를 행사하려 합니다 좋은 결과를 기대하고 싶습니다2025-06-03
-
[이슈와 관심] 29일 시청했으나 이제서야 댓글을 답니다 속이 타들어가는 느낌과 메스꺼움 그리고 온전치 않은 정신에 불편한 감정을 다스릴 수 없는 시기라 무슨 말을 피력하기가 참 어렵습니다 당분간은 이 상태일 듯 하네요 그럼에도 불구하고 뉴스타파의 노고에 박수를 보냅니다2025-06-01
-
[이슈와 관심] 미약하나마 동참했습니다2025-05-04
-
[생활 정보] 음 180원 다른 운을 기대해봐야겠네요2025-04-26
-
[생활 정보] 나라가 혼돈의 시기를 겪다 보니 봄을 만끽할 겨를 조차 느낄 수 없었네요 정보 감사합니다2025-04-07
-
[생활 정보] 새해 복 많이 받으십시오2025-01-31
댓글1
하늘구장님의 댓글
윈도우 서버 이용자라서 저도 한번 도전해 보고 싶네요
멋진 팁 고맙습니다
축하합니다. 첫 댓글로 29경험치를 획득하였습니다.