wordpress抓取文章第一张远程图片保存到本地的方法
这个动作我们使用一个hook来实现:
复制代码代码如下:
add_action('publish_post', 'fetch_images',999);
再创建一个fetch_images函数,来实现本文所说的所有功能。
复制代码代码如下:
function fetch_images( $post_ID ){
if ( defined('DOING_AUTOSAVE') && DOING_AUTOSAVE ) return;
if ( !current_user_can('edit_post', $post_ID) ) return;
$post = get_post($post_ID);
接下来,我们要获取文章内容中的第一张图片:
复制代码代码如下:
$first_image = '';
preg_match('/<img.+class="lazy" data-src=[\'\"]([^\'\"]+)[\'\"].* \/>/i',$post->post_content,$images);
if(!empty($images))foreach($images as $image){
if(strpos($image,'http') === 0){
$first_image = $images[1];
break;
}
}
但实际上,通过上述的代码获得的图片class="lazy" data-src可能也是有问题的,或者根本没有抓取到数据。不过我们先不考虑这些问题,我们先实现本文的目标。
接下来就是关键代码一,它要实现“抓取-保存到本地”两个功能:
复制代码代码如下:
$get = wp_remote_get( $get_image_class="lazy" data-src );
$type = wp_remote_retrieve_header( $get, 'content-type' );
$file_name = basename($get_image_class="lazy" data-src);
$file_content = wp_remote_retrieve_body($get);
$mirror = wp_upload_bits($file_name,null,$file_content);
这个地方有一个变化,上面我们获得了$first_image,这个地方的$get_image_class="lazy" data-src是上述得到的要抓取的远程图片地址。
在WordPress中,提供了wp_remote_get、wp_remote_retrieve_body等原创抓取和信息获取函数,你可以查看官方文档以了解和remote相关的函数。wp_upload_bits则将抓取到的图片的二进制内容保存到本地,根据其文件类型,最终成为本地保存的图片,并将保存完后获得的本地图片信息保存在$mirror中。
既然已经保存到本地了,接下来就是将图片信息保存到数据库中。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341