Qiita 記事見ました! 素敵なニュースサイトですね!
恐らく既知の問題とは思いましたが、クロールしてきた各サイトの meta image が http プロトコルなせいで足引っ張られてしまっていますね。以下行にあたる部分で、取得した URL が http だった場合には……という例外対応を入れてあげれば基本的には問題なさそうですが、先方が https 対応できていない場合がつらいですね。
とはいえ画像を全部収集するのも ? な感じで、こういう場合どうするのがベストプラクティスなんだろうか、と思ったのでちょっと書かせていただきました。
(最初、強制的に https で取得するようにして、アクセスできなかった場合にのみ手元に保存する……?)
|
// og:titleがある場合はそちらを優先 |
|
const ogTitle = $("meta[property='og:title']").attr("content"); |
|
if (typeof ogTitle !== "undefined" && ogTitle !== "") { |
|
page.title = ogTitle; |
|
} |
Qiita 記事見ました! 素敵なニュースサイトですね!
恐らく既知の問題とは思いましたが、クロールしてきた各サイトの meta image が http プロトコルなせいで足引っ張られてしまっていますね。以下行にあたる部分で、取得した URL が http だった場合には……という例外対応を入れてあげれば基本的には問題なさそうですが、先方が https 対応できていない場合がつらいですね。
とはいえ画像を全部収集するのも ? な感じで、こういう場合どうするのがベストプラクティスなんだろうか、と思ったのでちょっと書かせていただきました。
(最初、強制的に https で取得するようにして、アクセスできなかった場合にのみ手元に保存する……?)
menthas/src/backend/crawler/webpage-client.js
Lines 39 to 43 in 1696060