技术记录频道

网站全部分类

提交收录

php代码|采集爱站“相关词”，然后写入html页面（php采集网页数据）

时间：2023-07-05 03:02:15 阅读：1117

第一个思路是先用php代码采集相关词写入guanjianci.txt文件。代码如下：

效果图：

<?php

// 设置要抓取的网页地址
$urls = array(
    'https://ciku.aizhan.com/c135/relatedwords/',
    'https://ciku.aizhan.com/c135/relatedwords_2/',
    'https://ciku.aizhan.com/c135/relatedwords_3/',
    'https://ciku.aizhan.com/c135/relatedwords_4/',
    'https://ciku.aizhan.com/c135/relatedwords_5/'
);

// 遍历每个页面
foreach ($urls as $url) {
  
    // 抓取网页内容
    $html = file_get_contents($url);
  
    // 解析 HTML
    $dom = new DOMDocument();
    @$dom->loadHTML($html);
  
    // 获取所有 <td class="title"> 标签
    $tds = $dom->getElementsByTagName('td');
  
    // 遍历所有标签，找到 class="title" 的标签
    foreach ($tds as $td) {
        if ($td->getAttribute('class') === 'title') {
            // 获取标签内的网址和中文内容
            $link = $td->getElementsByTagName('a')->item(0)->getAttribute('href');
            $text = trim($td->nodeValue);
          
            // 将结果写入文件
            file_put_contents('guanjianci.txt', $link . ' ' . $text . PHP_EOL, FILE_APPEND);
        }
    }
}
?>

2.利用php代码写入html网页output.html，代码如下：

<?php

// 打开 guanjianci.txt 文件，读取所有行
$lines = file('guanjianci.txt');

// 打开 output.html 文件以写入方式
$fp = fopen('output.html', 'w');

// 遍历每一行，将 HTML 写入文件
foreach ($lines as $line) {
    // 分离出网址和文本内容
    list($url, $text) = explode(' ', trim($line), 2);

    // 构造 HTML <a> 标签
    $html = "1
    <a href='$url'>$text</a><br>\n
    ";
  
    // 将 HTML 写入文件
    fwrite($fp, $html);
}

// 关闭文件
fclose($fp);

echo 'HTML 写入完毕。';
?>

凉生鸡腿穿越火线模拟器外挂 cfmios辅助官网 DNFios自瞄辅助地下城与勇士自瞄辅助英雄联盟手游辅助和平精英手游版本暗区突围ios外挂

猜你喜欢

2025-04-22 06:42:34php代码|统计蜘蛛|统计ip
2025-01-02 22:31:03php代码|Z-BlogPHP系统
2024-12-24 02:47:20一键创建rdp文件，远程链接桌面
2024-12-23 23:18:27ssh命令|用命令禁止删除或者重命名文件防篡改
2024-12-18 17:24:11js代码|镶入iframe
2024-12-13 21:25:48网站优化代码
2024-12-08 21:42:43php代码|记录所有文件的更新时间
2024-12-04 17:44:15html+js代码|老版本调用随机链接
2024-12-04 15:26:50php-html-js代码|一个新的思路调用TXT文件内的链接
2024-12-04 13:00:19html-js代码|模拟用户点击a标签

友情链接

网友评论