txxxxc / isucon11-qualify

0 stars 0 forks source link

タイムアウトの原因を知る #16

Closed txxxxc closed 3 months ago

txxxxc commented 3 months ago

なんかタイムアウトでスコアの増加が妨げられてるっぽいけど全然分からん とりあえずタイムアウトがトラッキングできるような仕組みを作る


txxxxc commented 3 months ago


txxxxc commented 3 months ago

echoのタイムアウトのミドルウェアがあるからこれ使ってみるか https://echo.labstack.com/docs/middleware/timeout

txxxxc commented 3 months ago


txxxxc commented 3 months ago


00:11:13.140902 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 201): 202 (POST: /api/isu)
00:11:13.375745 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/af32c612-e0fc-493e-8677-d03eba4f46ee)
00:11:13.813556 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/72c53edf-1f76-4423-93bf-eca0d43b2afc)
00:11:13.860036 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/72c53edf-1f76-4423-93bf-eca0d43b2afc)
00:11:14.061327 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/b313ea49-e201-44e3-856b-6f9cb278d705/icon)
00:11:14.072516 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/4c2e15d5-4225-47e7-a771-5148185b8442)
00:11:14.081635 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/72c53edf-1f76-4423-93bf-eca0d43b2afc)
00:11:14.231522 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/72c53edf-1f76-4423-93bf-eca0d43b2afc)
00:11:14.370364 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 201): 202 (POST: /api/isu)
00:11:14.372501 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 201): 202 (POST: /api/isu)
00:11:14.612448 ERR: load: status code: 期待する HTTP ステータスコード以外が返却されました (expected: 200,304): 202 (GET: /api/isu/efc0fd51-8746-4a1a-8e9f-4a9cfbd5e1ed)
txxxxc commented 3 months ago


2024-06-08  0:13:41 60 [Warning] Aborted connection 60 to db: 'isucondition' user: 'isucon' host: 'localhost' (Got timeout reading communication packets)
txxxxc commented 3 months ago


txxxxc commented 3 months ago


txxxxc commented 3 months ago


txxxxc commented 3 months ago


| COUNT | 1XX | 2XX  | 3XX |  4XX  | 5XX | METHOD |             URI              |  MIN  |  MAX  |   SUM    |  AVG  |  P90  |  P95  |  P99  | STDDEV | MIN(BODY) | MAX(BODY)  |  SUM(BODY)   | AVG(BODY)  |
| 51350 | 0   | 4249 | 0   | 47101 | 0   | POST   | ^/api/condition/[\w\d-]+$    | 0.004 | 0.144 | 4982.652 | 0.097 | 0.104 | 0.104 | 0.104 | 0.014  | 0.000     | 139.000    | 1541.000     | 0.030      |
| 605   | 0   | 244  | 0   | 361   | 0   | GET    | ^/api/isu/[\w\d-]+$          | 0.012 | 3.004 | 390.756  | 0.646 | 1.000 | 1.004 | 1.004 | 0.461  | 0.000     | 160.000    | 25608.000    | 42.327     |
| 512   | 0   | 169  | 0   | 343   | 0   | POST   | /api/isu                     | 0.004 | 1.008 | 355.168  | 0.694 | 1.000 | 1.004 | 1.004 | 0.388  | 0.000     | 8298.000   | 26196.000    | 51.164     |
| 178   | 0   | 49   | 0   | 129   | 0   | GET    | /api/isu                     | 0.408 | 3.000 | 130.728  | 0.734 | 1.004 | 1.004 | 3.000 | 0.528  | 0.000     | 10000.000  | 44105.000    | 247.781    |
| 261   | 0   | 196  | 0   | 65    | 0   | GET    | ^/api/isu/[\w\d-]+/icon$     | 1.000 | 3.004 | 67.084   | 0.257 | 1.000 | 1.000 | 3.000 | 0.496  | 0.000     | 135259.000 | 3817980.000  | 14628.276  |
| 223   | 0   | 80   | 0   | 143   | 0   | POST   | /api/auth                    | 0.008 | 3.008 | 48.120   | 0.216 | 1.000 | 1.000 | 3.000 | 0.514  | 0.000     | 19.000     | 1288.000     | 5.776      |
| 36    | 0   | 8    | 0   | 28    | 0   | GET    | /api/trend                   | 0.028 | 1.004 | 28.580   | 0.794 | 1.000 | 1.004 | 1.004 | 0.387  | 0.000     | 4495.000   | 33952.000    | 943.111    |
| 120   | 0   | 76   | 0   | 44    | 0   | GET    | ^/api/isu/[\w\d-]+/graph$    | 1.000 | 1.004 | 9.840    | 0.082 | 0.140 | 0.988 | 1.000 | 0.249  | 0.000     | 6875.000   | 347623.000   | 2896.858   |
| 165   | 0   | 117  | 0   | 48    | 0   | GET    | ^/api/condition/[\w\d-]+$    | 0.012 | 1.000 | 7.996    | 0.048 | 0.004 | 0.372 | 1.000 | 0.189  | 0.000     | 6382.000   | 238502.000   | 1445.467   |
| 4     | 0   | 4    | 0   | 0     | 0   | POST   | /initialize                  | 0.320 | 0.488 | 1.584    | 0.396 | 0.488 | 0.488 | 0.488 | 0.069  | 23.000    | 23.000     | 92.000       | 23.000     |
| 258   | 0   | 48   | 210 | 0     | 0   | GET    | /assets/vendor.ee7444dd.js   | 0.000 | 0.088 | 1.476    | 0.006 | 0.016 | 0.044 | 0.072 | 0.015  | 0.000     | 743417.000 | 35684016.000 | 138310.140 |
| 258   | 0   | 48   | 210 | 0     | 0   | GET    | /assets/index.23dac98b.js    | 0.000 | 0.068 | 1.376    | 0.005 | 0.012 | 0.032 | 0.052 | 0.010  | 0.000     | 26667.000  | 1280016.000  | 4961.302   |
| 258   | 0   | 48   | 210 | 0     | 0   | GET    | /assets/favicon.d0f5f504.svg | 0.000 | 0.072 | 1.368    | 0.005 | 0.012 | 0.036 | 0.056 | 0.011  | 0.000     | 592.000    | 28416.000    | 110.140    |
| 258   | 0   | 48   | 210 | 0     | 0   | GET    | /assets/index.144d8ca8.css   | 0.000 | 0.060 | 1.076    | 0.004 | 0.008 | 0.028 | 0.048 | 0.009  | 0.000     | 19066.000  | 915168.000   | 3547.163   |
| 110   | 0   | 88   | 22  | 0     | 0   | GET    | /                            | 0.004 | 0.048 | 0.508    | 0.005 | 0.012 | 0.016 | 0.024 | 0.007  | 0.000     | 528.000    | 46464.000    | 422.400    |
| 54    | 0   | 40   | 0   | 14    | 0   | GET    | /api/user/me                 | 0.000 | 0.044 | 0.416    | 0.008 | 0.020 | 0.032 | 0.044 | 0.010  | 21.000    | 45.000     | 1755.000     | 32.500     |
| 258   | 0   | 48   | 210 | 0     | 0   | GET    | /assets/logo_white.svg       | 0.000 | 0.060 | 0.416    | 0.002 | 0.004 | 0.004 | 0.044 | 0.006  | 0.000     | 3285.000   | 157680.000   | 611.163    |
| 44    | 0   | 44   | 0   | 0     | 0   | GET    | /assets/logo_orange.svg      | 0.000 | 0.044 | 0.212    | 0.005 | 0.020 | 0.024 | 0.044 | 0.011  | 3288.000  | 3288.000   | 144672.000   | 3288.000   |
| 108   | 0   | 36   | 72  | 0     | 0   | GET    | ^/isu/[\w\d-]+/condition$    | 0.000 | 0.004 | 0.096    | 0.001 | 0.004 | 0.004 | 0.004 | 0.002  | 0.000     | 528.000    | 19008.000    | 176.000    |
| 30    | 0   | 8    | 0   | 22    | 0   | POST   | /api/signout                 | 0.000 | 0.012 | 0.044    | 0.001 | 0.004 | 0.004 | 0.012 | 0.003  | 21.000    | 21.000     | 462.000      | 15.400     |
| 36    | 0   | 36   | 0   | 0     | 0   | GET    | ^/isu/[\w\d-]+/graph$        | 0.000 | 0.004 | 0.028    | 0.001 | 0.004 | 0.004 | 0.004 | 0.002  | 528.000   | 528.000    | 19008.000    | 528.000    |
| 36    | 0   | 36   | 0   | 0     | 0   | GET    | ^/isu/[\w\d-]+$              | 0.004 | 0.004 | 0.028    | 0.001 | 0.004 | 0.004 | 0.004 | 0.002  | 528.000   | 528.000    | 19008.000    | 528.000    |
| 12    | 0   | 4    | 8   | 0     | 0   | GET    | /register                    | 0.004 | 0.004 | 0.008    | 0.001 | 0.004 | 0.004 | 0.004 | 0.001  | 0.000     | 528.000    | 2112.000     | 176.000    |
| 1     | 0   | 0    | 0   | 1     | 0   | GET    | /index.asp                   | 0.000 | 0.000 | 0.000    | 0.000 | 0.000 | 0.000 | 0.000 | 0.000  | 71.000    | 71.000     | 71.000       | 71.000     |
txxxxc commented 3 months ago


txxxxc commented 3 months ago

ログ見たらだいたい499が多かった この499でタイムアウトが多いのが良くないのか;;

txxxxc commented 3 months ago


txxxxc commented 3 months ago




* **クライアント側のタイムアウト:** クライアントが設定したタイムアウト時間内にサーバーからの応答がなかった場合。
* **クライアントによるリクエストのキャンセル:** ユーザーがブラウザの「停止」ボタンを押す、ページをリロードする、または他のページに移動するなど、何らかの理由でリクエストをキャンセルした場合。



* **サーバー側の問題:**
    * サーバーの過負荷
    * スクリプトの実行時間の長さ
    * ネットワークの遅延
* **クライアント側の問題:**
    * クライアントのネットワーク環境の不安定さ
    * クライアントの設定ミス



* 【5つの方法】HTTP 499エラーを解決するには - Kinsta: [https://kinsta.com/jp/knowledgebase/499-error/](https://kinsta.com/jp/knowledgebase/499-error/)
* Nginxのステータスコード499とは - ISU ワザップ: [https://scrapbox.io/isuwazap/Nginx%E3%81%AE%E3%82%B9%E3%83%86%E3%83%BC%E3%82%BF%E3%82%B9%E3%82%B3%E3%83%BC%E3%83%89499%E3%81%A8%E3%81%AF](https://scrapbox.io/isuwazap/Nginx%E3%81%AE%E3%82%B9%E3%83%86%E3%83%BC%E3%82%BF%E3%82%B9%E3%82%B3%E3%83%BC%E3%83%89499%E3%81%A8%E3%81%AF)



txxxxc commented 3 months ago


| COUNT | METHOD |             URI              |  MIN  |  AVG  |  MAX  |   SUM    |
| 51350 | POST   | ^/api/condition/[\w\d-]+$    | 0.004 | 0.097 | 0.144 | 4982.652 |



txxxxc commented 3 months ago


txxxxc commented 3 months ago

てかそもそもタイムアウトのやつで死ぬ原因が分からん 一旦300秒くらいにしてみる?

txxxxc commented 3 months ago


txxxxc commented 3 months ago


txxxxc commented 3 months ago

これ変えたらめちゃくちゃ固まった てかそもそも#7でランダムのPOSTドロップ解消したけど、解消前でもリクエスト捌ききれてなかったのに、リクエスト数増やしても意味ないやんではある。なので、一旦revertしたほうがいい説あります。



txxxxc commented 3 months ago

もうちょいタイムアウトのやつ見てみますか ていうかminimum reproductionが求められるかもしれん タイム・アウトしたときにどのようなレスポンスが返されるか知らん https://echo.labstack.com/docs/middleware/timeout

txxxxc commented 3 months ago


package main

import (


// main server function

func main() {

    e := echo.New()
        Skipper:      middleware.DefaultSkipper,
        ErrorMessage: "custom timeout error message returns to client",
        OnTimeoutRouteErrorHandler: func(err error, c echo.Context) {
            c.Logger().Errorf("Timeout path: %s", c.Path())
        Timeout: 5 * time.Second,
    e.GET("/", func(c echo.Context) error {
        // wait for 10 seconds
        time.Sleep(10 * time.Second)
        // returns response
        return c.String(200, "Hello, World!")
    // run server

## server log
{"time":"2024-06-08T15:26:54.511756+09:00","level":"ERROR","prefix":"echo","file":"main.go","line":"21","message":"Timeout path: /"}

## curl
❯ curl http://localhost:8080
custom timeout error message returns to client
txxxxc commented 3 months ago

一旦503が帰ってるぽいです。 これでなぜバグるのか

* Host localhost:8080 was resolved.
* IPv6: ::1
* IPv4:
*   Trying [::1]:8080...
* Connected to localhost (::1) port 8080
> GET / HTTP/1.1
> Host: localhost:8080
> User-Agent: curl/8.6.0
> Accept: */*
< HTTP/1.1 503 Service Unavailable
< Date: Sat, 08 Jun 2024 06:33:21 GMT
< Content-Length: 46
< Content-Type: text/plain; charset=utf-8
* Connection #0 to host localhost left intact
custom timeout error message returns to client⏎
txxxxc commented 3 months ago




proxy_intercept_errorsディレクティブが有効な場合: このディレクティブが有効になっていると、upstreamサーバー(APIサーバー)からエラーが返ってきた際に、nginxが指定したエラーページを表示し、ステータスコードを200 OKに変換します。
txxxxc commented 3 months ago

202が帰ったり、各エンドポイントで変なステータスコードが返ってくる理由は分からん。 nginxを経由したらなにかわかるかもしれん

txxxxc commented 3 months ago


txxxxc commented 3 months ago


sudo lsof -i -P -n | grep LISTEN
txxxxc commented 3 months ago


* `sudo`: 管理者権限でコマンドを実行します。ネットワーク関連の情報にアクセスするために必要です。
* `lsof`: "list open files" の略で、開いているファイルやネットワークソケットを一覧表示するコマンドです。
* `-i`: ネットワーク関連のファイル (ソケット) のみを表示します。
* `-P`: ポート番号をサービス名ではなく数値で表示します。
* `-n`: IPアドレスとポート番号を名前解決せず、数値で表示します。これにより、DNSルックアップの遅延を避けることができます。
* `|`: パイプ演算子で、`lsof` の出力を `grep` コマンドに渡します。
* `grep`: 指定したパターンに一致する行を抽出するコマンドです。
* `LISTEN`: リッスン状態のソケット (つまり、接続を受け入れる準備ができているポート) を持つ行のみを抽出します。

txxxxc commented 3 months ago

これバグってますやん https://github.com/labstack/echo/issues/1953

txxxxc commented 3 months ago


sudo nginx -T
txxxxc commented 3 months ago

なんかもういったん分からんのでとりあえずやめます。 いうてlogの499を見たらわかる説。そっちの線で行くわ

txxxxc commented 3 months ago


txxxxc commented 3 months ago


01:04:36.841052 score: 5491(5494 - 3) : pass
01:04:36.843469 <=== sendResult finish
01:04:36.843453 deduction: 0 / timeout: 31
txxxxc commented 3 months ago

今日の格言 今のリクエスト数も捌けてないのに、トラフィックを増やすな!

txxxxc commented 3 months ago


isucon:~$ cat /var/log/nginx/access.log | grep '\"status\":\"499\"' | grep -v "POST /api/condition" | jq '.uri'
txxxxc commented 3 months ago
