cherry-studio-app/src/services/TokenService.ts at main · clcssg/cherry-studio-app · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
import { approximateTokenSize } from 'tokenx'

import type { Assistant, Usage } from '@/types/assistant'
import type { FileMetadata } from '@/types/file'
import { FileTypes } from '@/types/file'
import type { Message } from '@/types/message'
import { findFileBlocks, getMainTextContent, getThinkingContent } from '@/utils/messageUtils/find'

import { loggerService } from './LoggerService'

const logger = loggerService.withContext('TokenService')

/**
 * 估算文本内容的 token 数量
 *
 * @param text - 需要估算的文本内容
 * @returns 返回估算的 token 数量
 */
export function estimateTextTokens(text: string) {
  return approximateTokenSize(text)
}

/**
 * 估算图片文件的 token 数量
 *
 * 根据图片文件大小计算预估的 token 数量。
 * 当前使用简单的文件大小除以 100 的方式进行估算。
 *
 * @param file - 图片文件对象
 * @returns 返回估算的 token 数量
 */
export function estimateImageTokens(file: FileMetadata) {
  return Math.floor(file.size / 100)
}

/**
 * 估算用户输入内容（文本和文件）的 token 用量。
 *
 * 该函数只根据传入的 content（文本内容）和 files（文件列表）估算，
 * 不依赖完整的 Message 结构，也不会处理消息块、上下文等信息。
 *
 * @param {Object} params - 输入参数对象
 * @param {string} [params.content] - 用户输入的文本内容
 * @param {FileMetadata[]} [params.files] - 用户上传的文件列表（支持图片和文本）
 * @returns {Promise<Usage>} 返回一个 Usage 对象，包含 prompt_tokens、completion_tokens、total_tokens
 */
export async function estimateUserPromptUsage({
  content,
  files
}: {
  content?: string
  files?: FileMetadata[]
}): Promise<Usage> {
  let imageTokens = 0

  if (files && files.length > 0) {
    const images = files.filter(f => f.type === FileTypes.IMAGE)

    if (images.length > 0) {
      for (const image of images) {
        imageTokens = estimateImageTokens(image) + imageTokens
      }
    }
  }

  const tokens = estimateTextTokens(content || '')

  return {
    prompt_tokens: tokens,
    completion_tokens: tokens,
    total_tokens: tokens + (imageTokens ? imageTokens - 7 : 0)
  }
}

/**
 * 估算完整消息（Message）的 token 用量。
 *
 * 该函数会自动从 message 中提取主文本内容、推理内容（reasoningContent）和所有文件块，
 * 统计文本和图片的 token 数量，适用于对完整消息对象进行 usage 估算。
 *
 * @param {Partial<Message>} message - 消息对象，可以是完整或部分 Message
 * @returns {Promise<Usage>} 返回一个 Usage 对象，包含 prompt_tokens、completion_tokens、total_tokens
 */
export async function estimateMessageUsage(message: Partial<Message>): Promise<Usage> {
  const fileBlocks = await findFileBlocks(message as Message)
  const files = fileBlocks.map(f => f.file)

  let imageTokens = 0

  if (files.length > 0) {
    const images = files.filter(f => f.type === FileTypes.IMAGE)

    if (images.length > 0) {
      for (const image of images) {
        imageTokens = estimateImageTokens(image) + imageTokens
      }
    }
  }

  const content = getMainTextContent(message as Message)
  const reasoningContent = getThinkingContent(message as Message)
  const combinedContent = [content, reasoningContent].filter(s => s !== undefined).join(' ')
  const tokens = estimateTextTokens(combinedContent)

  return {
    prompt_tokens: tokens,
    completion_tokens: tokens,
    total_tokens: tokens + (imageTokens ? imageTokens - 7 : 0)
  }
}

export async function estimateMessagesUsage({
  assistant,
  messages
}: {
  assistant: Assistant
  messages: Message[]
}): Promise<Usage> {
  const outputMessage = messages.pop()!

  const prompt_tokens = await estimateHistoryTokens(assistant, messages)
  const { completion_tokens } = await estimateMessageUsage(outputMessage)

  return {
    prompt_tokens,
    completion_tokens,
    total_tokens: prompt_tokens + completion_tokens
  } as Usage
}

export async function estimateHistoryTokens(assistant: Assistant, msgs: Message[]) {
  logger.info('assistant', assistant.id, msgs.length)
  // const { contextCount } = getAssistantSettings(assistant)
  // const maxContextCount = contextCount
  // const messages = filterMessages(filterContextMessages(takeRight(msgs, maxContextCount)))

  // // 有 usage 数据的消息，快速计算总数
  // const uasageTokens = messages
  //   .filter(m => m.usage)
  //   .reduce((acc, message) => {
  //     const inputTokens = message.usage?.total_tokens ?? 0
  //     const outputTokens = message.usage!.completion_tokens ?? 0
  //     return acc + (message.role === 'user' ? inputTokens : outputTokens)
  //   }, 0)

  // // 没有 usage 数据的消息，需要计算每条消息的 token
  // let allMessages: MessageItem[][] = []

  // for (const message of messages.filter(m => !m.usage)) {
  //   const items = await getMessageParam(message)
  //   allMessages = allMessages.concat(items)
  // }

  // const prompt = assistant.prompt
  // const input = flatten(allMessages)
  //   .map(m => m.content)
  //   .join('\n')

  // return estimateTextTokens(prompt + input) + uasageTokens

  // todo
  return 99999
}