FEATURE: add a table to audit OpenAI usage (#45)

Still need to build a job to purge logs
2023-04-26 11:44:29 +10:00 · 2023-04-26 11:44:29 +10:00 · 2cd60a4b3b
parent f6c30e8df9
commit 2cd60a4b3b
4 changed files with 96 additions and 5 deletions
--- a/app/models/ai_api_audit_log.rb
+++ b/app/models/ai_api_audit_log.rb
@ -0,0 +1,7 @@
 # frozen_string_literal: true
 class AiApiAuditLog < ActiveRecord::Base
  module Provider
    OpenAI = 1
  end
 end
--- a/db/migrate/20230424055354_create_ai_api_audit_logs.rb
+++ b/db/migrate/20230424055354_create_ai_api_audit_logs.rb
@ -0,0 +1,15 @@
 # frozen_string_literal: true
 class CreateAiApiAuditLogs < ActiveRecord::Migration[7.0]
  def change
    create_table :ai_api_audit_logs do |t|
      t.integer :provider_id, null: false
      t.integer :user_id
      t.integer :request_tokens
      t.integer :response_tokens
      t.string :raw_request_payload
      t.string :raw_response_payload
      t.timestamps
    end
  end
 end
--- a/lib/shared/inference/openai_completions.rb
+++ b/lib/shared/inference/openai_completions.rb
@ -14,6 +14,7 @@ module ::DiscourseAi
        top_p: nil,
        max_tokens: nil,
        stream: false,
        user_id: nil,
        &blk
      )
        raise ArgumentError, "block must be supplied in streaming mode" if stream && !blk
@ -39,7 +40,8 @@ module ::DiscourseAi
          write_timeout: TIMEOUT,
        ) do |http|
          request = Net::HTTP::Post.new(url, headers)
-          request.body = payload.to_json
+          request_body = payload.to_json
          request.body = request_body
          response = http.request(request)
@ -50,24 +52,44 @@ module ::DiscourseAi
            raise CompletionFailed
          end
          log =
            AiApiAuditLog.create!(
              provider_id: AiApiAuditLog::Provider::OpenAI,
              raw_request_payload: request_body,
              user_id: user_id,
            )
          if stream
-            stream(http, response, &blk)
+            stream(http, response, messages, log, &blk)
          else
-            JSON.parse(response.read_body, symbolize_names: true)
+            response_body = response.body
            parsed = JSON.parse(response_body, symbolize_names: true)
            log.update!(
              raw_response_payload: response_body,
              request_tokens: parsed.dig(:usage, :prompt_tokens),
              response_tokens: parsed.dig(:usage, :completion_tokens),
            )
            parsed
          end
        end
      end
-      def self.stream(http, response)
+      def self.stream(http, response, messages, log)
        cancelled = false
        cancel = lambda { cancelled = true }
        response_data = +""
        response_raw = +""
        response.read_body do |chunk|
          if cancelled
            http.finish
            break
          end
          response_raw << chunk
          chunk
            .split("\n")
            .each do |line|
@ -75,7 +97,15 @@ module ::DiscourseAi
              next if data == "[DONE]"
-              yield JSON.parse(data, symbolize_names: true), cancel if data
+              if data
                json = JSON.parse(data, symbolize_names: true)
                choices = json[:choices]
                if choices && choices[0]
                  delta = choices[0].dig(:delta, :content)
                  response_data << delta if delta
                end
                yield json, cancel
              end
              if cancelled
                http.finish
@ -85,6 +115,16 @@ module ::DiscourseAi
        end
      rescue IOError
        raise if !cancelled
      ensure
        log.update!(
          raw_response_payload: response_raw,
          request_tokens: DiscourseAi::Tokenizer.size(extract_prompt(messages)),
          response_tokens: DiscourseAi::Tokenizer.size(response_data),
        )
      end
      def self.extract_prompt(messages)
        messages.map { |message| message[:content] || message["content"] || "" }.join("\n")
      end
    end
  end
--- a/spec/shared/inference/openai_completions_spec.rb
+++ b/spec/shared/inference/openai_completions_spec.rb
@ -18,6 +18,8 @@ describe DiscourseAi::Inference::OpenAiCompletions do
      },
    ).to_return(status: 200, body: body, headers: {})
    user_id = 183
    prompt = [role: "user", content: "write 3 words"]
    completions =
      DiscourseAi::Inference::OpenAiCompletions.perform!(
@ -26,10 +28,24 @@ describe DiscourseAi::Inference::OpenAiCompletions do
        temperature: 0.5,
        top_p: 0.8,
        max_tokens: 700,
        user_id: user_id,
      )
    expect(completions[:choices][0][:message][:content]).to eq(
      "1. Serenity\n2. Laughter\n3. Adventure",
    )
    expect(AiApiAuditLog.count).to eq(1)
    log = AiApiAuditLog.first
    request_body = (<<~JSON).strip
      {"model":"gpt-3.5-turbo","messages":[{"role":"user","content":"write 3 words"}],"temperature":0.5,"top_p":0.8,"max_tokens":700}
    JSON
    expect(log.provider_id).to eq(AiApiAuditLog::Provider::OpenAI)
    expect(log.request_tokens).to eq(12)
    expect(log.response_tokens).to eq(13)
    expect(log.raw_request_payload).to eq(request_body)
    expect(log.raw_response_payload).to eq(body)
  end
  it "raises an error if attempting to stream without a block" do
@ -88,5 +104,18 @@ describe DiscourseAi::Inference::OpenAiCompletions do
    end
    expect(content).to eq("Mountain Tree ")
    expect(AiApiAuditLog.count).to eq(1)
    log = AiApiAuditLog.first
    request_body = (<<~JSON).strip
      {"model":"gpt-3.5-turbo","messages":[{"role":"user","content":"write 3 words"}],"stream":true}
    JSON
    expect(log.provider_id).to eq(AiApiAuditLog::Provider::OpenAI)
    expect(log.request_tokens).to eq(5)
    expect(log.response_tokens).to eq(4)
    expect(log.raw_request_payload).to eq(request_body)
    expect(log.raw_response_payload).to eq(payload)
  end
 end